로민 ‘텍스트스코프’, 공공행정문서 인식 정밀도 99% 기록

인식 까다로운 필기체도 98% 기록…로민 AI 문서이해 솔루션, TTA BMT서 성능 입증

  • 카카오공유 
  • 메타공유 
  • X공유 
  • 네이버밴드 공유 
  • 프린트
  • 메일
  • 스크랩
  • 목록
  • 글자크기
  • 크게
  • 작게

▲사진=로민


인공지능(AI) 문서이해 기술 전문기업 로민(대표 강지홍)은 문서이해 솔루션 ‘텍스트스코프 스튜디오’가 한국정보통신기술협회(TTA)가 진행한 품질성능평가시험(BMT)에서 공공행정문서 인식 정밀도 99%, 필기체 비정형서식 인식 정밀도 98%의 높은 성능을 보였다고 14일 밝혔다.

로민은 이번 성과를 통해 방대한 공공·행정기록물의 전자화를 앞당겨 업무 효율성을 크게 높이는 한편, 기록물 데이터의 활용도를 높여 공공분야의 디지털 전환을 앞당길 수 있을 것으로 기대하고 있다. 

로민에 따르면, 공공기관이 보유한 기록물은 수 십년 전 발간돼 문서 이미지 품질이 좋지 않아 기존 솔루션으로는 인식률이 낮아 폭넓은 활용이 어려웠다. 특히 공공기록물 인식에 특화된 로민의 문서이해 솔루션을 공공 도서관 및 행정기관의 원문 DB 구축 등에 적용하면 대국민 입법 및 학술 정보 서비스 제공과 AI 학습용 데이터 제공이 한층 원활해질 것으로 보인다. 

최근 행정안전부는 2025년까지 주요 공공서비스의 디지털 전환율을 80%까지 끌어올리고, 행정·공공 클라우드 전환율 100% 달성을 통해 디지털 기반 공공서비스 설계를 가속화하겠다고 밝혔다. 이러한 흐름을 바탕으로 공공분야에서 문서이해 및 AI OCR 기술의 수요도 크게 확대되고 있다.

로민은 2021년부터 행정안전부 국가기록원과 협업해 필기체 기록물 인식기술을 상용화하는데 기여했다. 필기체 문자인식(OCR) 기술은 다양한 필체 인식의 어려움 등으로 난이도가 높아 실제 업무에 적용할 만한 상용화된 솔루션이 없었으나, 로민은 필기체 기록물 특성에 최적화된 높은 성능의 모델을 구현하고 실제 공급까지 마쳤다. 

로민은 텍스트스코프 스튜디오가 스캔, 팩스문서, 공공기록물 등 저품질·저화질 이미지 데이터를 사전 학습해 오래된 기록물에 특화된 문서이해 솔루션으로 노이즈가 많고 식별이 까다로운 문서 이미지도 정확하게 인식한다고 설명했다. 솔루션에 적용된 AI 엔진은 로민 기술연구소가 자체 개발한 엔진으로, 국내 최대 AI 챌린지에서 두 차례 과학기술정보통신부장관상을 수상하며 높은 기술력을 인정받았다. 또 업계 최초로 신기술(NET) 인증을 획득했다.

로민은 입증된 성능을 바탕으로 높은 신뢰성과 업무 정확도가 요구되는 공공기관과 금융권에 솔루션 공급을 이어가고 있다고 밝혔다. 국가기록원을 비롯해 한국수출입은행, 한국환경공단, SGI서울보증보험, 한국평가데이터 등의 공공기관과 흥국생명, 교보생명, 라이나생명, 신한은행, 국민카드, 카카오뱅크 등 금융권과 협력하며 산업 각 분야의 디지털 전환을 지원하고 있다.

김민지 기자 honest@datanews.co.kr