온더아이티, ‘BizOnAI V-OCR’로 문서 이해 기술의 새 기준 제시

  • 카카오공유 
  • 메타공유 
  • X공유 
  • 네이버밴드 공유 
  • 프린트
  • 메일
  • 스크랩
  • 목록
  • 글자크기
  • 크게
  • 작게
인공지능(AI) 기반 엔터프라이즈 솔루션 기업 온더아이티는 문서 속 텍스트는 물론 표·이미지·차트·도형까지 구조적으로 이해하는 멀티모달 AI 인식 엔진 ‘BizOnAI V-OCR’을 전 산업군을 대상으로 본격 확대 적용한다고 28일 밝혔다.

이번에 공개된 V-OCR은 기존 OCR 기술의 ‘문자 인식’을 뛰어넘어, 문서를 구성하는 모든 시각 요소를 분석·분리·해석하는 Vision 기반 문서 이해 엔진으로, 기업·공공·금융·의료·제조 등 업종을 가리지 않고 폭넓게 활용 가능한 범용 AI 기술이라는 점에서 주목받고 있다.

온더아이티의 BizOnAI V-OCR은 페이지 단위 문서 레이아웃을 먼저 파악한 뒤, 문서 내 제목·본문·표·이미지·도형·부연설명 영역을 자동 탐지·구조화하는 Hybrid Layout Detection 기술을 기반으로 한다. 

온더아이티 관계자는 “V-OCR은 단순 텍스트 OCR과 달리 문서의 의미적 구조까지 이해하는 기술이기 때문에 비정형 문서가 많은 국내 산업 환경에 특히 적합하다”고 설명했다.

V-OCR의 진가는 온더아이티의 AI 멀티모달 검색엔진 ‘BizOnAI V-Search’와 결합했을 때 뚜렷하게 나타난다. 기존 검색엔진이 텍스트 중심으로만 작동했다면, V-Search는 V-OCR이 구조화한 시각 정보를 기반으로 ▲복잡한 문단 구조 ▲표 속 주요 수치 ▲이미지 캡션과 시각 요소까지 탐색할 수 있다. 업계에서는 이를 두고 문서 내 모든 시각 정보를 검색 대상으로 확장한 국내 최고 수준의 검색엔진이라는 평가가 나온다.

V-OCR의 멀티모달 분석 능력은 온더아이티가 전사 문서 환경 혁신을 위해 출시한 ‘BizOnAI V-Drive’에도 그대로 적용된다. 문서가 업로드되면 V-OCR이 즉시 문서 레이아웃과 객체를 분석하고, V-Search와 연동해 문서 기반 검색, 자동요약, 챗봇 기반 질의응답 및 근거 제시 기능을 제공한다. 즉, 기존의 ‘문서를 저장하는 Drive’를 넘어 ‘문서를 이해하고 답변하는 Drive’로 진화한 셈이다.

이를 기반으로 복잡한 보고서·제안서·분석자료에서도 필요한 정보를 신속하게 찾아낼 수 있어, 공공·금융·제조·의료 등 문서 의존도가 높은 산업군 전반에서 관심이 높아지고 있다.

온더아이티는 이번 BizOnAI V-OCR, V-Search, V-Drive의 통합 출시를 통해 기업 문서 환경의 중심을 ‘보관(Storage)’에서 ‘지식 활용(Knowledge Operation)’으로 옮기겠다는 전략을 발표했다.

이병구 온더아이티 대표는 “국내 업무 환경은 문서 중심으로 구성돼 있지만 대부분의 문서는 이미지·표·차트 등 다양한 시각 요소를 포함하고 있어 기존 시스템만으로는 활용이 쉽지 않았다”며, “V-OCR을 중심으로 문서를 구조화하고, V-Search와 V-Drive를 통해 활용·검색·협업까지 연결하는 엔드투엔드 문서 지능화 기술을 완성했다”고 말했다.

이어 그는 “온더아이티는 V-OCR을 기반으로 다양한 산업 현장에서 활용 가능한 차세대 문서 AI 생태계를 확장해 나갈 것”이라고 덧붙였다.

BizOnAI V-OCR은 단순 인식 기술을 넘어 문서를 읽고, 구조화하고, 검색하고, 활용하는 전 과정의 혁신을 이끄는 핵심 엔진이다. 온더아이티는 문서가 많은 곳이라면 어디든 적용되는 AI 기술을 바탕으로 전 산업군을 대상 V-OCR 생태계를 확장해 나갈 계획이다.

박혜연 기자 phy@datanews.co.kr