OCR 모델 학습을 누구나 쉽고 강력하게! - [스타뷰 Vol. 5] 업스테이지 라벨링 스페이스의 창현님 & 인하님 & 주현님
스타들의 업스테이지 이야기를 담는 스타뷰, 다섯 번째 주인공은 노코드-로우코드 솔루션 ‘OCR Pack’에서 유의미한 학습 데이터를 만들 수 있게 해주는 ‘OCR 라벨링 스페이스’의 창현님, 인하님, 주현님입니다. 누구나 쉽고 강력하게 사용할 수 있는 어노테이션 툴을 개발해 다양한 산업의 디지털 혁신을 돕는 스타들의 이야기를 만나보세요.
“최고의 제품을 만들기 위한 과정이라는 공감대가 있었고 협업 과정에서 서로에 대한 신뢰가 있었기 때문에 큰 문제 없이 프로젝트를 진행할 수 있었어요. 함께 일하면서 얻은 경험이 굉장히 좋았고 덕분에 업스테이지에 대한 애정도 더 많이 생긴 것 같아요!”
— 창현님, 인하님, 주현님
최근 업스테이지는 한화생명에 광학문자인식(OCR) 솔루션 'Document AI'를 최초로 공급 계약 체결하며 '노코드-로코드'(No-code, Low-code) 솔루션의 성공적인 첫 출사표를 던졌습니다! Document AI는 진료비 영수증 등 보험 청구에 필요한 서류 5가지를 AI에 기반한 OCR 기술로 읽어 들여 효율적으로 처리하고, 모델 개발과 운영까지 수월하게 할 수 있는 것이 특징이라고 하는데요. [최고 성능의 AI OCR, Upstage Document AI 보러가기 →]
이러한 Document AI 탄생에는 숨은 주역들이 있습니다. 바로 Document AI에 raw 데이터를 넣었을 때 어노테이션을 하여 모델에 유의미한 학습 데이터를 만들어주는 ‘업스테이지 라벨링 스페이스’의 개발에 힘써주신 분들입니다. Document AI 개발팀의 창현님, 프로덕트 디자인팀의 인하님, 데이터팀의 주현님까지 세 분의 이야기를 스타뷰에서 만나보세요!
‘업스테이지 라벨링 스페이스’ 탄생의 숨은 주역
창현님, 인하님, 주현님의 공통점을 아시나요? “업스테이지 라벨링 스페이스를 있게 한 주역들이다?!” 물론, 정답입니다. 그 외에도 세분은 다음과 같은 공통점이 있다고 하는데요.
- 분주하게 움직이는 것을 좋아하며 사교적이다.
- 밝은 성격의 소유자로 항상 주변에 많은 사람들이 있다.
- 머리가 좋고 목표가 생기면 노력을 아끼지 않는다.
- 협동심이 좋고 사람과의 관계를 중요시 여긴다.
- 꾸준히 경험과 재산을 축적해 간다.
- 융통성이 있고 생각이 유연하다.
- 어려움에 처하더라도 실력 발휘를 잘 한다.
태어난 해의 십이간지에서 엿볼 수 있는 성향을 일부 발췌한 내용입니다. 쥐띠의 좋은 성향을 두루두루 갖춘 세분은 운명처럼 ‘쥐띠’해에 태어난 스타로서 자칭 ‘쥐띠클럽’을 결성했다고 하는데요. 운명같은 시너지가 기대되는 세 분의 이야기를 자세히 들어볼까요?
‘업스테이지 라벨링 스페이스’가 완성되기까지
반갑습니다. 각자 소개 부탁드려요.
창현: Document AI 팀 소속 software engineer 민창현입니다. 제주에 거주 중이고 현업에서 13년 정도 개발자로 일하고 있어요. 현재는 팀에서 Document AI의 모든 부분을 팀원들과 함께 개발하고 있습니다.
인하: 저는 2021년 11월에 업스테이지에 입사했고 프로덕트 디자인팀에서 주희님, 건희님, 캐리, 동심님, 팀(Tim)과 함께 일하고 있어요. 입사 이후 홈페이지 리뉴얼을 진행했고 이번 어노테이션 툴 v2 프로젝트를 진행하면서 팀과 함께 Document AI에 집중하고 있어요.
주현: 저는 업스테이지에 온지 2년이 넘었네요. 입사 초기에는 데이터팀이 없었어요. ‘데이터 매니저’라는 포지션으로 합류해서 데이터 구축과 함께 NLP 분야의 일을 했는데요. NLP와 OCR로 나눠져 있던 데이터를 하나로 아우르는 팀이 필요하겠다는 니즈가 생겨서 작년 1월에 데이터팀이 신설되었어요. 팀 초창기에는 리더인 지윤님과 제가, 그리고 이후 남혁님, 라일, 유정님, 철영님이 합류하면서 더욱 굳건한 팀을 만들게 되었죠.
업스테이지 라벨링 스페이스(어노테이션 툴 v2) 개발이 성공적으로 끝났는데요.
이 프로젝트에는 어떤 분들이 참여하셨나요?
창현: 어노테이션 툴 v2는 참여 인원으로 보면 꽤 큰 프로젝트 였어요. Document AI 개발팀 전원이 개발에 참여했고 기획과 디자인 영역에서 디자인팀의 인하님과 리나가 참여했어요. 또 데이터팀의 주현님, 남혁님, 지윤님 등이 어노테이션 툴의 실제 사용자, 운영자 입장에서 기획과 기능 검증 부분에 적극 참여해주셨습니다.
세 분은 각자 어떤 역할을 하셨나요?
창현,인하,주현: 데이터팀은 어노테이션 툴의 쓰임, 필요 요소, 구성 등 여러 니즈를 파악하며 기획과 검증단의 고민을해주셨고 제작 중심의 개발/디자인은 소프트웨어 엔지니어팀과 인하님이 담당을 했어요. 그리고 창현님이 PM역할로 어노테이션 툴의 리드를 맡아주셨습니다.
창현: 네, 저는 백엔드와 프론트엔드 개발을 담당했고요. 개발팀을 대표해서 타 팀과 커뮤니케이션을 하며 툴의 스펙을 정하고 툴 개발 전반을 매니징하는 역할을 했어요.
인하: 회사/팀마다 디자인의 역할 규정이 다른데요. 저는 기능으로 제공되는 것, 사용자에게 행동을 유도하는 것 등 기초적인 기능을 설계했어요. 그리고 기술적으로 구현이 가능할지, 어떻게 구현하면 좋을지 이런 논의들을 개발팀과 함께 했는데요. 이번 프로젝트를 통해 기획, UI, UX까지 디자인 전반을 경험해볼 수 있었어요.
주현: 저는 사용자/운영자 입장에서 툴의 기능 기획, 설계를 위한 가이드로 참여했어요. 실사용자에게 주로 발생하는 에러가 뭔지, 그 사용자들에게 제일 어려운 게 뭔지, 또 어떤 기능이 필요한지에 대한 의견을 전달하고 또 검증하는 과정을 거쳤어요. 덕분에 처음부터 끝까지 같이 만들어가는 신기하고 즐거운 경험이었어요!
“어노테이션 툴(Annotation tool)”은 무엇인가요?
주현: 쉽게 비유해보면 어노테이션 툴은 모델에 들어갈 연료를 만들어주는 툴이라고 할 수 있어요. 빈 깡통에 사업자등록증을 넣어주면 뭔지 모르니까 초벌 작업으로 ‘이게 뭐다’라고 약간의 학습 연료를 넣어주면 그걸 바탕으로 계속 진화를 하게 되는거에요. 그러면 다음에 전혀 본 적 없는 새로운 사업자등록증을 넣어줘도 ‘이게 무슨 값이다’를 알 수 있어요. 그래서 연료를 만들어주고 가공하는 툴이라고 할 수 있어요.
어노테이션의 중요성을 말씀드리고 싶은데요. 우리 Document AI는 제너럴(general) 모델과 특화 모델을 다 아우를 수 있어요. 제너럴 모델은 어떤 이미지가 들어와도 그 안에 있는 텍스트를 기본적으로 읽어내는 모델이에요. 특화 모델은 사업자등록증과 같이 범용이 아닌 특화된 데이터를 기반으로 학습된 모델이에요. 그래서 우리의 OCR은 제너럴은 기본이고 특이한 케이스도 대응할 수 있죠.
다만 특화 모델을 만들 때는 데이터가 모델을 학습시킬 수 있도록 양질의 데이터가 필요해요. 사업자등록증 특화 모델이면 사업자등록증 데이터를 많이 넣어줘야 하죠. 업스테이지의 Pack의 개념이 여기에서 출발하는데 기본적으로 모델이 할 수 있는 건 우리가 제공해주고 특이한 케이스에 대한 학습 데이터를 사용자가 추가하면 그걸로 학습을 시킨다는게 Pack의 개념이에요. 그렇기 때문에 데이터를 추가해 주는 부분에서 어노테이션이 중요해져요. 보통 기업은 학습 데이터 형태가 아닌 raw 데이터를 가지고 있어요. 우리가 만든 툴로 어노테이션을 하면 모델에 유의미한 학습 데이터를 만들어주는 거죠! (초반에 데이터를 제대로 읽게 한다 = 업스테이지의 어노테이션 툴 = 업스테이지 라벨링 스페이스)
어노테이션 툴을 v1에서 v2로 업데이트하게 된 배경이 궁금합니다.
창현: 어노테이션 툴은 사실 2021년 6월부터 Document AI 모델 성능 개선을 위해서 꾸준히 내부적으로 개발, 운영되어 오던 소프트웨어에요. 당시 개발팀 멤버 중에서 대현님, 준엽님이 이전 회사의 경험을 살려서 첫 버전을 개발 중이었고, 제가 2021년 8월에 입사하면서 지호님까지 합류하여 다같이 v1을 완성했어요. 이후 데이터팀에서 작업자들과 툴을 사용해 보면서 많은 피드백을 주셨고 실제 Document AI에 포함될 제품으로 업데이트가 필요하다고 생각했죠. 그래서 어노테이션 툴 v2 프로젝트는 작년 1월부터 시작하게 되었습니다.
주현: (창현님이 잘 설명해주셨는데요.) AI 모델이나 데이터 학습을 위해서는 어노테이션 툴이 필요한데, v1은 Document AI PoC(Proof of concept)를 위한 기초적인 기능 중심으로 구현되어 있었어요. 내부적으로 쓰기에는 전혀 문제가 없지만, 제품화 하기 위해서는 한단계 개선이 필요했죠.
인하: 네! 그래서 작년 1월부터 4월까지 여러 팀이 힘을 합쳐 v1.2가 아닌 v2.0을 만들게 된거에요.
v2는 v1에 비해 어떤 점들이 달라졌나요? 가장 주력한 포인트가 있다면 무엇일까요?
창현: v2 개발시에 몇가지 도전적인 과제가 있었는데 판매할 수 있는 제품 수준의 UI로 끌어 올리는 것, 드로잉 도구 등 핵심 피처를 자체 기술로 개발 하는것, 그리고 실제 작업자들이 빠르고 편리하게 작업 하면서도 실수를 방지할 수 있게 하는것, 마지막으로 모델 학습에 필요한 데이터를 모두 생산해 내는 것이었어요. 사실 어느 하나 놓칠 수 없는 부분이라 모든 부분에 주력했다고 볼 수 있어요.
그 결과 OCR 어노테이션툴은 업스테이지에서 개발팀과 디자인팀이 협업하여 만든 첫번째 소프트웨어가 되었는데요. v1 에 비해서 UI, UX를 상당히 개선했고 핵심 기술들을 자체 개발하여 새로운 요구사항에 대해서도 빠르게 개발을 진행할 수 있는 코드베이스를 만들 수 있었어요. 또한 프로젝트에 참여해주신 분들이 효율적이고 효과적인 어노테이션 작업 방식에 대한 피드백을 적극적으로 주셔서 작업자를 위한 세부 기능들도 많이 개선되었어요.
이를 통해 궁극적으로는 고객이 Document AI 상에서 어노테이션툴을 활용해 자체 학습데이터를 생산할 수 있도록 쉽고도 강력한 툴을 만들고자 했습니다. v2는 작업 편의성과 회사 내부 팀의 요구사항 충족에 중점을 뒀다면, 앞으로는 Document AI와의 매끄러운 통합에 신경써서 팩이 실제 고객에게 전달되었을 때 고객들의 피드백을 반영하여 좋은 제품으로서의 어노테이션툴로 점점 진화시켜 나갈 계획이에요.
주현님과 인하님은 v2에서 어떤 부분에 가장 많은 노력을 기울이셨나요?
주현: 사용성 개선에 가장 많이 신경 썼어요. 실제 어노테이션을 하면 반복 작업을 해야 됐던 부분이 많아요. 일례로 정보가 같은 값이 될때에는 여러가지를 한꺼번에 박스에 담는 게 편하죠. 그래서 하나씩 선택 하는 방식 대신 멀티로 선택할 수 있게 해서 편의성을 높였어요. 또 에러를 줄일 수 있게 설계된 부분들이 있어요. 툴에서 어노테이션 결과로 점 개수를 짝수개로 찍게 설정을 했어요. 시스템적으로 점 개수가 홀수로 찍히는 것을 방지하여 잘못된 데이터가 나올 확률을 낮춘거죠. 그렇게 방어 체계를 만들어서 사용성을 개선하고 데이터 에러를 줄이도록 했어요.
인하: 디자인 설계할 때 원칙을 세워요. 어노테이션 툴의 경우 사용자의 정확한 행동을 유도하는 디자인이었어요. 어노테이션은 작업자분들이 교육을 받아도 사용자의 러닝커브에 따라 오류가 생기기 쉬워요. 그래서 사용자의 작은 실수가 모델에 반영되어 치명적인 오류나 에러로 작용하지 않도록, 또 이것이 쉽게 생기지 않도록 툴이 사용자의 행동을 잘 가이드 해주는 것을 목표로 했어요. 다음에는 어떤 행동을 해야 하는지 쉽고 직관적으로 나타냈고, 올바른 사용을 유도하기 위해 하지 말아야 하는 행동들은 막아줌으로써 두가지 원칙을 달성하고자 했습니다.
협업, 모두가 한 곳을 향해 가는 방법
협업이 굉장히 중요했을 것 같습니다. 창현님은 PM 역할을 하면서 어떠셨나요?
창현: 조직도 상에서 개발팀과 디자인팀, 데이터팀이 나눠져있기는 하지만 툴 개발 과정에서는 그냥 하나의 프로젝트 팀처럼 움직였던 것 같아요. 그래서 팀 간 협업이라기보다는 하나의 팀에서 서로 맡은 일을 하는 형태로 진행할 수 있었던 것 같아요. 특히 인하님은 개발팀의 모든 스크럼 세레모니(데일리 스크럼, 플래닝 및 백로그 그루밍, 데모와 회고 등)에 참여해 주셨어요.
프로젝트가 제대로된 방향으로 흘러가기 위해서는 실제 사용하는 고객의 빠른 피드백이 매우 중요한데 이 부분에 있어서 데이터팀이 큰 역할을 해주셨고요. 인하님과 제가 툴의 스펙을 정하면서 논의가 잘 진행이 안되면 주저 없이 데이터팀에게 도움을 요청을 했는데 그때마다 항상 좋은 피드백을 주셨어요. 워크스페이스 툴이 큰 역할을 했네요.
툴 개발 과정에서 하루 2-3 시간 정도 함께 논의하는 시간이 꽤나 자주 있었고, 일주일 안에 결정된 사항들이 두세 번 변경되는 일이 잦기도 했어요. 이게 큰 스트레스일 수도 있었는데 최고의 제품을 만들기 위한 과정이라는 공감대가 있었고 협업 과정에서 서로에 대한 신뢰가 있었기 때문에 큰 문제 없이 프로젝트를 진행할 수 있었던 부분이 만족스러워요.
반면에 결정이 자주 뒤집어졌던 이유는 요구사항에 대한 충분한 정보가 없거나 이해관계자들이 많은데 생각이 모두 다른 경우였어요. 특히 툴 개발 후반부에 어려운 기능들이 몰리면서 이런 일들이 좀 있었는데 이해관계자 파악부터 의견 수렴까지의 과정이 오래 걸렸어요. 어떻게 더 잘할 수 있을지는 아직 잘 모르겠지만 결국 만들고 고치는 과정의 반복이 좀 더 수월하게 진행될 수 있게 프로세스를 가다듬고 잦은 변경에도 멘탈이 흔들리지 않도록 마인드 셋이 필요한 것 같아요. 그리고 제품이 더 좋아진다는 믿음이 가장 중요한 것 같고요!
인하님과 주현님은 협업을 하면서 어려웠거나 고민이 된 점이 있으셨나요?
인하: 툴을 만들 때 이해관계자 모두를 충족할 수 없다는 부분이 가장 어려웠어요. 실제 어노테이션 작업을 하는 사용자가 있고 관리 어드민인 데이터팀이 있고 최종 소집된 데이터를 모델링하는 모델팀이 있잖아요. 각자 최종적으로 만들려고 하는 아웃풋에 대한 기대가 다를 수 있거든요. 그럼에도 여러 이해관계자들과 제한된 시간 내에 잘 조율하고 선택해서 의사결정해야 하는 과정이 필요한데.. 그게 어려웠던 것 같아요.
주현: 프로젝트를 진행했던 지난해에 저의 OKR 중 하나가 ‘v2 채널을 마련해서 빠르게 적용하는 프로세스를 만들자’였어요. v1 때는 어노테이션 툴의 데이터 관련 보이스를 잘 모을 수 있는 채널이 없어서 공수가 많이 들었어요. 그래서 이번에는 실제 작업자들이 수시로 버그 리포트에 오류를 기입하고 해당 파일을 데이터 팀, 개발팀이 같이 확인할 수 있도록 했어요. 이런 과정을 통해 의사결정 과정의 리소스를 줄이고 있는데요. 향후에는 ‘QA 게시판’도 마련해보고 싶어요.
협업 과정에서 기억에 남았던 일도 궁금해요.
인하: 2주마다 데모 세션(전체 개발 진척사항과 각자의 상황을 공유하는 시간)을 가졌는데요. 데모 세션 이후 개발팀과 별도의 회고 세션을 가진 게 참 좋았어요. 처음에는 ‘감사합니다’와 같은 줄글로 회고를 했고 이후 재호님이 다양한 액티비티를 만들어주셨어요. 일례로 ‘일주일 동안 나의 바이오 리듬 그려보기’가 기억에 남는데요. 이때 무슨 일이 있었고 뭐가 잘 안돼서 어떤 부분이 아쉬웠는지.. 이런 내용을 바이오리듬 그래프로 그려보고 서로 회고해 보는 자리였어요. 사실 그때 많이 지치기도 했거든요. 그런데 좋은 동료들과 솔직하게 회고를 하다보니 자연스레 리프레시가 되더라구요.
참! 미담 사연이 있어요. 제가 홈페이지 릴리즈 직전에 어노테이션 툴과 일정이 겹치는 기간이 있었거든요. 거의 한 달간은 매일 8시간 미팅이 있었는데, 어노테이션 툴이 사실 기능적으로 되게 복잡하다 보니 어느 순간 ‘내가 못해서 과정이 이렇게 힘든 건가’라는 생각이 들더라고요. 제가 해오던 일이다 보니 잘 끝내야지 하고 마음을 추스르며 일할 때인데, 그때 창현님이 “인하님 쉽지 않죠?”라고 말을 건네는 거예요. “어노테이션 툴이 생각보다 쉽지 않은데 힘들 것 같다. 사회 초년생 때 생각해 보면 나는 항상 멘탈이 먼저 나갔던 것 같다. 그래도 잘 쉬면서 해야, 잘 된다” 이런 말씀을 해주셨어요. 그 당시 그 말씀이 너무 든든하고 힘이 되었어요!
업스테이지 웨이를 실천하는 자세
평소 업스테이지 웨이에서 가장 중요하게 생각하는 항목이 있나요?
창현: 제가 일하면서 중요하게 생각하는 것은 원활한 협업을 위한 ‘원팀(One team)’ 정신입니다. 그래서 서로 신뢰를 바탕으로 즐겁게 일할 수 있는 분위기를 만드는 게 중요하다고 생각해요. 누구나 자유롭게 질문하고 의견을 제시하는 것이 자연스러운 분위기가 되도록 말이죠!
주현: 저도 ‘원팀’은 자연스레 실천하는 항목이고 늘 중요하게 생각하는 항목인데요. 비단 ‘원팀’은 자신이 속한 팀뿐만 아니라 여러 팀 간에도 중요한 것 같아요. 제가 하는 일에는 의사결정을 해야 하는 것들이 많은데 이게 개발팀, 모델팀 등 서로의 업무에 영향을 미치게 되어요. 그런데 한정된 리소스 안에서 의사결정을 하다 보니 모든 니즈를 반영하기는 어렵거든요. 그래서 원팀으로 일하는 게 중요하고 이를 위해 솔직한 소통이 있어야 한다고 생각해요. 어노테이션 툴 개발에 있어서 데이터팀이 툴을 사용하는 방법을 정확히 알고 원하는 요구 사항을 명확하게 전달해야, 이후 데이터 설계도 훨씬 수월할 거라는 생각이 들었는데요. 개발 공수, UI 구현 가능 여부 등의 조건들을 먼저 따지기 이전에 무엇이든 생각이나면 주저없이 의견을 드렸던 것 같아요. 그럼에도 ‘일단 얘기를 해봐요’라는 자세로 인하님과 창현님이 귀 기울여주셨고 이렇게 솔직한 의견이 오가는 상황이 거듭되면서 제가 더욱 재밌게 프로젝트에 본딩되어 참여할 수 있게 된 것 같아요!
업스테이지 웨이의 항목 중 실천이 어렵거나 고민이 되는 부분도 있을까요?
창현: 최근에 읽은 책에서 ‘팀의 목적은 목표 달성이 아니라 목표 일치다' 라는 문장을 보았는데 매우 공감하고 중요하다고 생각합니다. 그래서 치열한 논의로 최종 결정에 잘 다다를수 있도록 충분한 정보를 공유하고, 결정된 것은 잘 기록해서 사람들에게 인지시키는 부분을 잘하고 싶은데요. 제품을 만드는 팀 전체가 프로젝트의 현재 상황을 잘 인지하고 앞으로 나아가기 위해서 어떤 일들이 필요한지에 대한 공감을 가지도록 하고 싶습니다.
이번 프로젝트에서 디자인팀, 데이터팀과 논의하는 시간이 정말 길고 많았는데 모든 시간이 효율적인 시간이었는지 되돌아 보면서 어떻게 하면 좀 더 잘할 수 있었을지를 고민하고 있습니다. 한 가지 시도로는 지난 3월 한 달 정도 어노테이션툴 프로젝트 위클리 문서를 작성해 봤는데 일주일 동안 논의하고 결정했던 사항들과 툴의 프로젝트의 현재 상황을 정리하고 공유하는데 많은 도움이 됐어요. 이런 시도를 OCR Pack 개발에서 본격적으로 할 예정입니다.
인하: 저는 ‘Sharing’이요. 매번 스크럼 등을 통해 정보를 공유하지만 어려웠던 것 같아요. ‘공유를 어디까지 해야 되나’라는 부분이 고민되더라고요. 디자인과 개발 전반의 영역에서 1부터 10까지 사항이 있을 때 1부터 어디까지 공유해야 충분한 공유가 될지였어요. 개발 속도가 붙기 시작하면서 자연스레 개발팀과는 공유가 활발했지만, 저희 팀은 세부 히스토리까지 얼라인 하기에는 어려움이 있지 않았나 싶어요. 앞으로 효과적이고 효율적인 Sharing을 위해 좋은 방향을 찾고 계속 시도해 보고 싶어요.
앞으로의 계획, 그리고 고마움
앞으로의 계획이나 개인적인 포부가 있나요?
창현: Document AI 개발에 100% 집중할 예정이에요. 그동안 제품을 실제화하기 위해 충분한 준비 과정을 거쳤다고 생각해요. 이제는 남은 기간 동안 열심히 만들어서 회사의 대표 제품으로 시장에 내놓을 수 있도록 노력해야 해요. 개인적으로는 프로덕트 매니징과 피플 매니징 영역으로 역량을 넓히고 싶어요. 많은 엔지니어들이 매니징 영역에 발을 들여 놓는것을 두려워하거나 꺼려하는데 개인적으로는 조직이 올바른 방향으로 성장하기 위해서 매니징이 정말 중요한 것 같고 이 부분에 대해서 좀 더 공부하고 경험을 계속 쌓아 나가고 싶어요.
인하: 업스테이지의 첫 프로덕트인 Document AI가 어떤 모습일지 너무 기대가 되는데요. 저 또한 창현님과 더불어 Document AI 설계와 디자인에 집중할 계획이고요. 특히 Pack 설계에 있어서는 데이터 관리 부문을 담당할 예정이에요. 그리고 어노테이션 툴 개발을 계기로, HCI(Human Computer Interaction) 연구도 계속 이어갈 계획입니다! 데이터를 모으는 과정에서 사람의 영향이 굉장히 큰데요. 데이터 퀄리티와 효율성 측면에서 우리가 어떻게 다룰 수 있을지가 중요하지만, 아직 업계와 학계의 관심이 그리 높지는 않아요. 제가 HCI 분야 연구를 해왔던터라 컴퓨터와 사람이 상호작용할 때의 인터렉션이나 프로세스 자체를 많이 봐요. 우리가 실제 마주한 이 문제를 영구적으로 풀고싶다는 생각을 하고 있고 이를 위해 데이터팀 분들과 연구 미팅을 고정적으로 하고 있어요. 철영님도 원래 HCI를 하던 분이어서 저와 철영님은 일주일에 한 번씩 무조건 만나고 2주일에 한 번씩 주현님, 남혁님 이렇게 넷이서 전체 디벨롭 하는 스터디를 하고 있어요. 앞으로도 꾸준한 연구 스터디를 통해 연내 좋은 결실을 하나 맺고 싶어요!
주현: 저는 데이터 구축/설계에 포커스 하여 일하고 있는데요. 인하님과 일하면서 한 발자국 밖에서 이 데이터를 만드는 과정 자체를 메타로 바라보는, HCI를 많이 생각하게 되었어요. 저는 그런 관점에서 데이터가 만들어질 때 테크니컬한 레벨의 문제뿐만이 아니라 얽혀 있는 다른 여러 가지의 요인도 다시 생각해 보게 되었어요. 인하님 덕분에 시야가 넓어진 것 같아요. 그리고 올해 기회가 되면 방콕 등과 같은 좋은 곳에서 일해보고 싶어요. 해외로 나가 일할 수 있는 기회 자체가 쉽지 않은데 업스테이지는 어디서든 근무하는게 가능하니까 시도해 보고 싶어요.
업스테이지 스타분들께 전하고 싶은 말씀이 있다면 부탁드려요.
주현: 창현님께 직접 말씀드리지는 못했지만 덕분에 진짜 재밌게 의견 내면서 프로젝트를 할 수 있었어요. 앞으로도 데이터팀에서 ‘이런 기능 추가해주세요’ 같은 이야기를 하게 될 것 같은데요. 미리 감사드리고 잘 부탁드린다는 인사 전하고 싶어요.
인하: 슬랙에서 스타분들께 감사의 마음을 전하는 #all-thanks 채널에도 올리긴 했지만, 정말 많은 분들이 이 프로젝트에 연관되어 있어요. 직접적으로는 개발팀, 데이터팀이지만 모델팀도 있고 가까이는 BX팀의 리나도 계세요. 이렇게 많은 분들과 함께 재밌게 일할 수 있어서 좋았어요. 개발팀에서 어화둥둥~ 챙겨주신 점은 제게 많은 위안이 되었고요. 늘 먼저 알아봐주셨던 마음 자체가 되게 따뜻하고 고마웠어요. 어노테이션 툴도 좋은 아웃풋이긴 하지만, 많은 분들과 함께 일하며 얻은 경험이 굉장히 좋았던 것 같아요. 그리고 업스테이지에 대한 애정도 이 분들과 일하면서 더 많이 생겨난 것 같아요!
창현: 저도 모두에게 감사를 드리고 싶습니다! 엔딩 크레딧처럼 감사를 표현하고 싶은데요. 업스테이지 스타에게~! 그리고 Special Thanks to. 이준엽, 남대현, 권의현, 이재호, 이지호, 문수영, 백수영, 박미성, 차인하, 오주현, 김남혁, 한지윤
(이 인터뷰는 지난해에 진행되었으나 Document AI 출시에 맞춰 2023년에 공개하게 되었습니다. ‘업스테이지 라벨링 스페이스’는 올 상반기 리뉴얼을 위해 작업 중이라고 하니 앞으로 여러 산업 군의 실무에 적용될 Document AI의 활약에 많은 기대 부탁드립니다!)
[최고 성능의 AI OCR, Upstage Document AI 보러가기 →]
Event
데이터의 자산화를 통해 새로운 가치를 만들어 보세요
업스테이지 콘솔에서 Document AI API를 마음껏 테스트해 보시고 원하는 서비스를 만들어 보세요!
- 기본 모델 성능만으로도 95% 이상의 정확도를 자랑하는 노코드-로우코드 AI OCR 솔루션은?
- Upstage Document AI 알아보기