비즈니스의 미래를 선도하는 인공지는 솔루션
비즈니스 고민을 해결할 생성형 AI 모델이 필요하신가요?

업스테이지의 AI전문가와 함께 시작하세요!

복잡한 문서를 실제 업무 흐름에서 바로 활용할 수 있도록

업스테이지는 Document Parse Enhanced를 통해, 실제 업무 환경에서 자주 마주치는 복잡한 문서를 보다 안정적으로 해석하고 구조화할 수 있는 새로운 처리 모드(Beta)를 선보입니다.

Document Parse Enhanced는 기존 Document Parse의 확장 모드로, 표·차트·도표·체크박스 등 시각적 요소가 많은 문서에서 정확도와 결과 일관성을 크게 개선했습니다. 이를 통해 금융·제조·공공 등 엔터프라이즈 환경에서도 대량 문서를 효율적으로 처리하고, 실제 문서 기반 업무 흐름에 바로 적용할 수 있도록 설계되었습니다.

복잡한 문서 요소를 정확하게 이해하는 Enhanced Mode

기존 문서 파싱 시스템의 대부분은 텍스트 중심 접근에 기반하고 있습니다. 이 방식은 시각적 구조에 의존하는 문서—예를 들어 줄이 없는 테이블이나 여러 페이지에 걸친 표, 차트와 도표가 많은 문서—에서는 명확한 한계를 드러냅니다.

Document Parse Enhanced는 이러한 한계를 전제로 설계되었습니다. 문서의 시각적 구조와 요소 간의 관계를 함께 이해함으로써, 다음과 같은 복잡한 문서 요소를 안정적으로 인식하고 구조화합니다.

  • 복잡한 테이블
    멀티라인 셀, 선(line)이 없는 테이블, 여러 페이지에 걸친 테이블을 정확하게 인식합니다.
  • 차트
    단순 이미지를 넘어, 정형 데이터와 함께 맥락을 담은 자연어 설명으로 변환합니다.
  • 도표 및 다이어그램
    핵심 의미를 요약한 기계 판독 가능한 설명 형태로 제공됩니다.
  • 체크박스
    체크 및 미체크 상태를 신뢰도 있게 인식해 구조화합니다.

이 모든 기능은 별도의 신규 제품이 아니라, Document Parse의 하나의 처리 모드로 제공됩니다. 기존 API나 문서 처리 흐름을 변경하지 않고도, 문서의 복잡도에 따라 Enhanced mode를 선택해 사용할 수 있습니다.

Document Parse Enhanced는 어떻게 동작하나요

Document Parse Enhanced는 Document Parse가 이미 갖추고 있는 두 가지 핵심 강점, 즉 높은 OCR 정확도안정적인 비주얼 그라운딩을 기반으로 합니다. 여기에 복잡한 시각 요소를 이해하기 위한 Vision Language Model 접근을 적용해 기능을 확장했습니다.

그 결과, Enhanced mode는 다음과 같은 작업을 수행할 수 있습니다.

  • 복잡하고 선(line)이 없는 테이블 인식
    여러 페이지에 걸친 테이블 구조를 정확하게 인식합니다.
  • 차트 구조화 및 설명 생성
    차트를 정형 데이터로 변환하는 동시에, 맥락을 담은 자연어 설명을 함께 제공합니다.
  • 도표 및 다이어그램 요약
    LLM과 downstream 시스템이 의미를 이해할 수 있도록 핵심 내용을 요약합니다.
  • 체크박스 인식
    체크 및 미체크 상태를 안정적으로 인식해 구조화합니다.

Enhanced mode는 기존 텍스트와 레이아웃 인식이 이미 안정적인 영역 위에 추가적인 이해를 덧붙이는 방식으로 설계되었습니다. 이를 통해 문서 처리 워크플로우의 일관성을 유지하면서도, 보다 복잡한 시각 요소를 포함한 문서를 효과적으로 처리할 수 있습니다.

문서 워크플로우에서 중요한 정확도를 기준으로 한 성능 지표

아래 표는 업스테이지 내부 벤치마크인 dpp-bench-v1.4.0 기준으로 측정한 성능을 요약한 결과입니다.

Document Parse Enhanced는 단일 이미지나 개별 페이지 인식 성능을 극대화하는 데 초점을 맞추기보다, 문서 처리 워크플로우에서 실제로 중요한 구조 정확도, 결과 일관성, 그리고 처리 지연 시간의 균형을 고려해 설계되었습니다.

이 벤치마크는 실제 업무 환경에서 자주 등장하는 문서 패턴—밀도가 높은 테이블, 여러 페이지에 걸친 구조, 시각적으로 복잡한 레이아웃—을 기반으로 구성되었습니다. 문서 품질에 따라 결과는 달라질 수 있지만, 여기서 나타나는 성능 차이는 Enhanced mode가 실제 운영 환경에서 수작업을 줄이는 데 가장 효과적인 지점을 보여줍니다.

1. 복잡한 테이블 구조 인식

복잡한 테이블은 엔터프라이즈 문서에서 가장 흔하면서도, 동시에 가장 처리하기 어려운 요소 중 하나입니다. 여러 페이지에 걸쳐 이어지거나, 명확한 격자선이 없고, 엄격한 구조 대신 시각적 정렬에 의존하는 경우가 많기 때문입니다.

테이블 벤치마크 기준으로 보면, Enhanced mode는 기존 표준 파싱 방식 대비 구조 인식 정확도를 크게 개선하면서도, 실제 운영 환경에 적합한 처리 지연 시간을 유지합니다.

Dataset: dpp-bench-v1.4.0/table

특히 다음과 같은 점에서 차이가 나타납니다.

  • 테이블 구조 정확도(TEDS-S)가 기존 standard mode 대비 크게 향상되었습니다.
  • 범용 멀티모달 모델과 달리, 대량 문서 처리에 적합한 수준의 지연 시간을 유지합니다.

2. Multi-page table reconstruction

멀티페이지 테이블의 경우, 단순한 인식 정확도만으로는 충분하지 않습니다. 실제로 중요한 것은 여러 페이지에 걸친 테이블을 지연 시간 증가 없이, 대규모로 안정적으로 병합할 수 있는지 여부입니다.

아래 벤치마크 결과에서 보듯이, Document Parse Enhanced는 높은 병합 정확도를 유지하면서도 현저히 낮은 지연 시간을 제공합니다.

Dataset: dpp-bench-v1.4.0/table

여러 모델이 높은 병합 정확도를 달성하고 있지만, Document Parse Enhanced는 수백~수천 페이지를 연속 처리하는 문서 워크플로우에서도 병목을 만들지 않는 처리 속도를 통해 실질적인 운영 적합성을 보여줍니다.

3. 차트 및 도표 이해

"<header id='0' style='font-size:18px'>Performance Audit Report on the Control of FMD</header>

<figure id='2' data-category='chart'><img data-coord="top-left:(23,100); bottom-right:(565,266)" /><figure>
  <figurecaption>
    <chart_type>bar chart</chart_type>
    <chart_description>The bar chart displays cumulative vaccination coverage percentages across six selected zone 2 extension areas during the October 2014 TUBU FMD outbreak. Coverage ranges from 37% in TSU to 94% in NOKANENG, with NOKANENG showing the highest coverage and TSU the lowest. The chart compares vaccination progress among these areas, with NOKANENG having the highest cumulative percentage and TSU the lowest.</chart_description>

Document Parse Enhanced는 차트에서 단순히 수치를 추출하는 데 그치지 않고, 시각 요소를 이후 자동화에 활용 가능한 정보로 만드는 데 초점을 둡니다.

Enhanced mode는 차트와 도표를 정형화된 구조로 변환하는 동시에, 추세·관계·맥락을 담은 간결한 자연어 설명을 함께 생성합니다. 이를 통해 시각 요소는 이미지가 아닌, 검색·요약·분석·질의응답 등 다양한 downstream 작업에 활용할 수 있는 형태로 전환됩니다.

Dataset: dpp-bench-v1.4.0/chart,figure

정형 데이터와 함께 설명을 생성할 수 있다는 점은, 시각 요소를 검색·요약·추론 대상으로 활용할 수 있게 만든다는 의미입니다. 이러한 가치는 단순한 수치 점수만으로는 충분히 드러나지 않습니다.

차트 및 도표 점수는 각 모델이 차트나 도표가 포함된 페이지를 인식한 뒤, 그 결과를 GPT-4.1에 입력하고 작업별 질문을 통해 성능을 평가하는 방식으로 산출되었습니다.

표에서 확인할 수 있듯이, Enhanced mode는 최신 VLM 기반 모델과 유사한 수준의 이해 성능을 유지하면서도, 차트와 도표를 훨씬 낮은 지연 시간으로 인식해 실제 문서 워크플로우에 더 적합한 특성을 보여줍니다.

4. Checkbox recognition

체크박스는 작은 시각 요소이지만, 다양한 양식과 문서에서 업무 정확도에 직접적인 영향을 미치는 핵심 요소입니다.

Dataset: dpp-bench-v1.4.0/checkbox

Enhanced mode는 아직 지속적으로 고도화 중인 영역임에도 불구하고, 범용 멀티모달 모델 대비 더 높은 체크박스 인식 정확도를 이미 보여주고 있습니다. 현재는 특히 밀도가 높고 레이아웃이 복잡한 문서 환경을 중심으로 성능 개선이 이어지고 있습니다.

Enhanced mode를 기존 워크플로우에 쉽게 적용하세요

Document Parse는 현재 세 가지 처리 모드를 지원하며, 팀은 문서 유형과 처리 요구에 따라 정확도, 속도, 비용의 균형을 유연하게 선택할 수 있습니다.

  1. Standard mode (mode=standard)
  2. 일반적인 문서 파싱 작업에 적합한 기본 모드입니다.
  3. Enhanced mode (mode=enhanced)
  4. 복잡한 테이블, 차트, 도표, 그리고 시각적 요소가 밀집된 문서를 처리하는 데 적합한 모드입니다.
  5. Auto mode (mode=auto)
  6. 페이지 단위로 문서의 복잡도를 자동 분석해 Standard 또는 Enhanced mode로 라우팅합니다. 이를 통해 정확도를 극대화하면서도 비용을 효율적으로 관리할 수 있습니다.

Enhanced mode 호출 예시

(아래 예시는 Enhanced mode를 명시적으로 지정해 호출하는 방식입니다.)

curl -X POST \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: multipart/form-data" \
  -F "document=@./test.pdf" \
  -F "model=document-parse-nightly" \
  -F "mode=enhanced" \
  https://api.upstage.ai/v1/document-digitization

문서 기반 업무의 다음 단계를 만들어갑니다

Document Parse Enhanced는 오늘날 팀이 문서를 통해 자동화할 수 있는 범위를 한 단계 확장합니다. 특히 복잡한 테이블, 차트, 도표와 같은 요소가 업무 흐름을 지연시키던 환경에서, 문서를 보다 안정적으로 구조화하고 활용할 수 있도록 설계되었습니다.

업스테이지는 다양한 문서 유형과 레이아웃에 대한 지원 범위를 지속적으로 확장해 나가고 있으며, 그 목표는 단순합니다. 기존에 사용하던 문서 처리 방식이나 워크플로우를 바꾸지 않고도, 문서 기반 업무를 더 쉽고 신뢰도 높게 만드는 것입니다.

이는 금융·제조·공공을 포함한 국내 엔터프라이즈 환경에서 흔히 접하는 대량 문서 처리, 반복적인 검토 업무, 그리고 후속 자동화 흐름 전반에 자연스럽게 연결될 수 있도록 고려된 방향입니다.

What’s next

Document Parse Enhanced는 현재 Beta로 제공되고 있으며, 실제 업무 환경에서 시각적으로 복잡한 문서를 보다 안정적으로 처리하는 데 초점을 맞추고 있습니다. 테이블, 차트, 도표, 체크박스와 같은 요소는 그동안 사용자들로부터 가장 많은 요청을 받아온 영역이며, 이번 릴리스는 이러한 요구에 대응하기 위한 중요한 기반을 마련합니다.

이 기반 위에서 업스테이지는 고객들이 지속적으로 제기해 온 추가적인 문서 과제들도 순차적으로 다뤄나가고 있습니다. 손글씨 인식, 도장 및 서명 검출, 폰트 스타일 식별, 저품질 스캔 문서 처리 등은 현재 내부적으로 연구 및 개선이 진행 중이며, 준비가 완료되는 대로 제품 업데이트를 통해 단계적으로 제공될 예정입니다.

Enhanced mode는 1월 말까지 기존 Document Parse standard mode와 동일한 가격으로 제공됩니다. 복잡한 문서가 포함된 실제 업무 흐름에 적용해 보고, Beta 기간 동안의 사용 경험과 피드백을 공유하기에 적합한 시점입니다.

Learn more

Document Parse Enhanced 복잡한 문서를 실제 업무에 바로 활용하는 새로운 방식

Jisu Yim
Jisu Yim
Announcements
December 17, 2025
Document Parse Enhanced  복잡한 문서를 실제 업무에 바로 활용하는 새로운 방식
완전히 안전한 AI 글쓰기
비즈니스 고민을 해결할 생성형 AI 모델이 필요하신가요?

업스테이지의 AI전문가와 함께 시작하세요!
문서 기반 업무 개선을 준비하고 계신가요?

사전 알림 신청 시 문서 10,000장을 테스트할 수 있는 무료 크레딧을 드립니다.

비즈니스의 미래를 선도하는 인공지능 솔루션
비즈니스 고민을 해결할 생성형 AI 모델이 필요하신가요?

업스테이지의 AI전문가와 함께 시작하세요!

복잡한 문서를 실제 업무 흐름에서 바로 활용할 수 있도록

업스테이지는 Document Parse Enhanced를 통해, 실제 업무 환경에서 자주 마주치는 복잡한 문서를 보다 안정적으로 해석하고 구조화할 수 있는 새로운 처리 모드(Beta)를 선보입니다.

Document Parse Enhanced는 기존 Document Parse의 확장 모드로, 표·차트·도표·체크박스 등 시각적 요소가 많은 문서에서 정확도와 결과 일관성을 크게 개선했습니다. 이를 통해 금융·제조·공공 등 엔터프라이즈 환경에서도 대량 문서를 효율적으로 처리하고, 실제 문서 기반 업무 흐름에 바로 적용할 수 있도록 설계되었습니다.

복잡한 문서 요소를 정확하게 이해하는 Enhanced Mode

기존 문서 파싱 시스템의 대부분은 텍스트 중심 접근에 기반하고 있습니다. 이 방식은 시각적 구조에 의존하는 문서—예를 들어 줄이 없는 테이블이나 여러 페이지에 걸친 표, 차트와 도표가 많은 문서—에서는 명확한 한계를 드러냅니다.

Document Parse Enhanced는 이러한 한계를 전제로 설계되었습니다. 문서의 시각적 구조와 요소 간의 관계를 함께 이해함으로써, 다음과 같은 복잡한 문서 요소를 안정적으로 인식하고 구조화합니다.

  • 복잡한 테이블
    멀티라인 셀, 선(line)이 없는 테이블, 여러 페이지에 걸친 테이블을 정확하게 인식합니다.
  • 차트
    단순 이미지를 넘어, 정형 데이터와 함께 맥락을 담은 자연어 설명으로 변환합니다.
  • 도표 및 다이어그램
    핵심 의미를 요약한 기계 판독 가능한 설명 형태로 제공됩니다.
  • 체크박스
    체크 및 미체크 상태를 신뢰도 있게 인식해 구조화합니다.

이 모든 기능은 별도의 신규 제품이 아니라, Document Parse의 하나의 처리 모드로 제공됩니다. 기존 API나 문서 처리 흐름을 변경하지 않고도, 문서의 복잡도에 따라 Enhanced mode를 선택해 사용할 수 있습니다.

Document Parse Enhanced는 어떻게 동작하나요

Document Parse Enhanced는 Document Parse가 이미 갖추고 있는 두 가지 핵심 강점, 즉 높은 OCR 정확도안정적인 비주얼 그라운딩을 기반으로 합니다. 여기에 복잡한 시각 요소를 이해하기 위한 Vision Language Model 접근을 적용해 기능을 확장했습니다.

그 결과, Enhanced mode는 다음과 같은 작업을 수행할 수 있습니다.

  • 복잡하고 선(line)이 없는 테이블 인식
    여러 페이지에 걸친 테이블 구조를 정확하게 인식합니다.
  • 차트 구조화 및 설명 생성
    차트를 정형 데이터로 변환하는 동시에, 맥락을 담은 자연어 설명을 함께 제공합니다.
  • 도표 및 다이어그램 요약
    LLM과 downstream 시스템이 의미를 이해할 수 있도록 핵심 내용을 요약합니다.
  • 체크박스 인식
    체크 및 미체크 상태를 안정적으로 인식해 구조화합니다.

Enhanced mode는 기존 텍스트와 레이아웃 인식이 이미 안정적인 영역 위에 추가적인 이해를 덧붙이는 방식으로 설계되었습니다. 이를 통해 문서 처리 워크플로우의 일관성을 유지하면서도, 보다 복잡한 시각 요소를 포함한 문서를 효과적으로 처리할 수 있습니다.

문서 워크플로우에서 중요한 정확도를 기준으로 한 성능 지표

아래 표는 업스테이지 내부 벤치마크인 dpp-bench-v1.4.0 기준으로 측정한 성능을 요약한 결과입니다.

Document Parse Enhanced는 단일 이미지나 개별 페이지 인식 성능을 극대화하는 데 초점을 맞추기보다, 문서 처리 워크플로우에서 실제로 중요한 구조 정확도, 결과 일관성, 그리고 처리 지연 시간의 균형을 고려해 설계되었습니다.

이 벤치마크는 실제 업무 환경에서 자주 등장하는 문서 패턴—밀도가 높은 테이블, 여러 페이지에 걸친 구조, 시각적으로 복잡한 레이아웃—을 기반으로 구성되었습니다. 문서 품질에 따라 결과는 달라질 수 있지만, 여기서 나타나는 성능 차이는 Enhanced mode가 실제 운영 환경에서 수작업을 줄이는 데 가장 효과적인 지점을 보여줍니다.

1. 복잡한 테이블 구조 인식

복잡한 테이블은 엔터프라이즈 문서에서 가장 흔하면서도, 동시에 가장 처리하기 어려운 요소 중 하나입니다. 여러 페이지에 걸쳐 이어지거나, 명확한 격자선이 없고, 엄격한 구조 대신 시각적 정렬에 의존하는 경우가 많기 때문입니다.

테이블 벤치마크 기준으로 보면, Enhanced mode는 기존 표준 파싱 방식 대비 구조 인식 정확도를 크게 개선하면서도, 실제 운영 환경에 적합한 처리 지연 시간을 유지합니다.

Dataset: dpp-bench-v1.4.0/table

특히 다음과 같은 점에서 차이가 나타납니다.

  • 테이블 구조 정확도(TEDS-S)가 기존 standard mode 대비 크게 향상되었습니다.
  • 범용 멀티모달 모델과 달리, 대량 문서 처리에 적합한 수준의 지연 시간을 유지합니다.

2. Multi-page table reconstruction

멀티페이지 테이블의 경우, 단순한 인식 정확도만으로는 충분하지 않습니다. 실제로 중요한 것은 여러 페이지에 걸친 테이블을 지연 시간 증가 없이, 대규모로 안정적으로 병합할 수 있는지 여부입니다.

아래 벤치마크 결과에서 보듯이, Document Parse Enhanced는 높은 병합 정확도를 유지하면서도 현저히 낮은 지연 시간을 제공합니다.

Dataset: dpp-bench-v1.4.0/table

여러 모델이 높은 병합 정확도를 달성하고 있지만, Document Parse Enhanced는 수백~수천 페이지를 연속 처리하는 문서 워크플로우에서도 병목을 만들지 않는 처리 속도를 통해 실질적인 운영 적합성을 보여줍니다.

3. 차트 및 도표 이해

"<header id='0' style='font-size:18px'>Performance Audit Report on the Control of FMD</header>

<figure id='2' data-category='chart'><img data-coord="top-left:(23,100); bottom-right:(565,266)" /><figure>
  <figurecaption>
    <chart_type>bar chart</chart_type>
    <chart_description>The bar chart displays cumulative vaccination coverage percentages across six selected zone 2 extension areas during the October 2014 TUBU FMD outbreak. Coverage ranges from 37% in TSU to 94% in NOKANENG, with NOKANENG showing the highest coverage and TSU the lowest. The chart compares vaccination progress among these areas, with NOKANENG having the highest cumulative percentage and TSU the lowest.</chart_description>

Document Parse Enhanced는 차트에서 단순히 수치를 추출하는 데 그치지 않고, 시각 요소를 이후 자동화에 활용 가능한 정보로 만드는 데 초점을 둡니다.

Enhanced mode는 차트와 도표를 정형화된 구조로 변환하는 동시에, 추세·관계·맥락을 담은 간결한 자연어 설명을 함께 생성합니다. 이를 통해 시각 요소는 이미지가 아닌, 검색·요약·분석·질의응답 등 다양한 downstream 작업에 활용할 수 있는 형태로 전환됩니다.

Dataset: dpp-bench-v1.4.0/chart,figure

정형 데이터와 함께 설명을 생성할 수 있다는 점은, 시각 요소를 검색·요약·추론 대상으로 활용할 수 있게 만든다는 의미입니다. 이러한 가치는 단순한 수치 점수만으로는 충분히 드러나지 않습니다.

차트 및 도표 점수는 각 모델이 차트나 도표가 포함된 페이지를 인식한 뒤, 그 결과를 GPT-4.1에 입력하고 작업별 질문을 통해 성능을 평가하는 방식으로 산출되었습니다.

표에서 확인할 수 있듯이, Enhanced mode는 최신 VLM 기반 모델과 유사한 수준의 이해 성능을 유지하면서도, 차트와 도표를 훨씬 낮은 지연 시간으로 인식해 실제 문서 워크플로우에 더 적합한 특성을 보여줍니다.

4. Checkbox recognition

체크박스는 작은 시각 요소이지만, 다양한 양식과 문서에서 업무 정확도에 직접적인 영향을 미치는 핵심 요소입니다.

Dataset: dpp-bench-v1.4.0/checkbox

Enhanced mode는 아직 지속적으로 고도화 중인 영역임에도 불구하고, 범용 멀티모달 모델 대비 더 높은 체크박스 인식 정확도를 이미 보여주고 있습니다. 현재는 특히 밀도가 높고 레이아웃이 복잡한 문서 환경을 중심으로 성능 개선이 이어지고 있습니다.

Enhanced mode를 기존 워크플로우에 쉽게 적용하세요

Document Parse는 현재 세 가지 처리 모드를 지원하며, 팀은 문서 유형과 처리 요구에 따라 정확도, 속도, 비용의 균형을 유연하게 선택할 수 있습니다.

  1. Standard mode (mode=standard)
  2. 일반적인 문서 파싱 작업에 적합한 기본 모드입니다.
  3. Enhanced mode (mode=enhanced)
  4. 복잡한 테이블, 차트, 도표, 그리고 시각적 요소가 밀집된 문서를 처리하는 데 적합한 모드입니다.
  5. Auto mode (mode=auto)
  6. 페이지 단위로 문서의 복잡도를 자동 분석해 Standard 또는 Enhanced mode로 라우팅합니다. 이를 통해 정확도를 극대화하면서도 비용을 효율적으로 관리할 수 있습니다.

Enhanced mode 호출 예시

(아래 예시는 Enhanced mode를 명시적으로 지정해 호출하는 방식입니다.)

curl -X POST \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: multipart/form-data" \
  -F "document=@./test.pdf" \
  -F "model=document-parse-nightly" \
  -F "mode=enhanced" \
  https://api.upstage.ai/v1/document-digitization

문서 기반 업무의 다음 단계를 만들어갑니다

Document Parse Enhanced는 오늘날 팀이 문서를 통해 자동화할 수 있는 범위를 한 단계 확장합니다. 특히 복잡한 테이블, 차트, 도표와 같은 요소가 업무 흐름을 지연시키던 환경에서, 문서를 보다 안정적으로 구조화하고 활용할 수 있도록 설계되었습니다.

업스테이지는 다양한 문서 유형과 레이아웃에 대한 지원 범위를 지속적으로 확장해 나가고 있으며, 그 목표는 단순합니다. 기존에 사용하던 문서 처리 방식이나 워크플로우를 바꾸지 않고도, 문서 기반 업무를 더 쉽고 신뢰도 높게 만드는 것입니다.

이는 금융·제조·공공을 포함한 국내 엔터프라이즈 환경에서 흔히 접하는 대량 문서 처리, 반복적인 검토 업무, 그리고 후속 자동화 흐름 전반에 자연스럽게 연결될 수 있도록 고려된 방향입니다.

What’s next

Document Parse Enhanced는 현재 Beta로 제공되고 있으며, 실제 업무 환경에서 시각적으로 복잡한 문서를 보다 안정적으로 처리하는 데 초점을 맞추고 있습니다. 테이블, 차트, 도표, 체크박스와 같은 요소는 그동안 사용자들로부터 가장 많은 요청을 받아온 영역이며, 이번 릴리스는 이러한 요구에 대응하기 위한 중요한 기반을 마련합니다.

이 기반 위에서 업스테이지는 고객들이 지속적으로 제기해 온 추가적인 문서 과제들도 순차적으로 다뤄나가고 있습니다. 손글씨 인식, 도장 및 서명 검출, 폰트 스타일 식별, 저품질 스캔 문서 처리 등은 현재 내부적으로 연구 및 개선이 진행 중이며, 준비가 완료되는 대로 제품 업데이트를 통해 단계적으로 제공될 예정입니다.

Enhanced mode는 1월 말까지 기존 Document Parse standard mode와 동일한 가격으로 제공됩니다. 복잡한 문서가 포함된 실제 업무 흐름에 적용해 보고, Beta 기간 동안의 사용 경험과 피드백을 공유하기에 적합한 시점입니다.

Learn more