와이즈넛, 글·음성·이미지·영상 데이터 모두 처리한다

멀티모달 RAG 과제 착수…LLM 구조적 한계 극복, 사용자 의도 파악 더 정확해져

와이즈넛, 글·음성·이미지·영상 데이터 모두 처리한다
최근 대규모언어모델(LLM)이 가진 문제를 해결할 수 있는 검색증강생성(Retrieval-Augmented Generation, RAG) 기술의 중요성이 날로 커져가는 가운데, 텍스트 이외에도 음성, 이미지, 동영상 등 다양한 데이터를 결합하여 추론이 가능한 ‘멀티모달 RAG 기술’이 AI와 인간이 구사하는 인지사고의 편차를 현저히 줄일 것으로 각광받고 있다.

인공지능(AI) 전문기업 와이즈넛(대표 강용성)은 과학기술정보통신부가 주관하는 정보통신방송기술개발사업 중 정보통신기획평가원이 추진하는 ‘멀티모달 데이터 입력 기반 검색증강생성 기술 개발’ 과제의 주관사로서 1차년도 연구에 착수했다고 29일 밝혔다.

2027년까지 4년간 진행되는 이 연구는 실제 업무환경에서 융합되어 활용되는 멀티모달 데이터를 기반으로 LLM의 구조적, 성능적 한계로 제기되는 ▲최신화된 정보유지의 어려움 ▲할루시네이션 ▲도메인 정보 부족 ▲대규모 컴퓨팅자원소요 등의 한계를 극복하는 멀티모달 RAG 기술 개발을 목표로 한다.

와이즈넛은 이번 과제에서 멀티모달 데이터 수집 및 처리, 검색, 통합관리 기술 개발에 주력한다. 자체 보유하고 있는 LLM 기술 기반 RAG 기술을 적용해 멀티모달 질의 이해 및 답변 생성기술부터 LLM의 성능을 높이기 위한 언어모델 최신화 기술, 효율적인 데이터 학습 및 관리를 위한 RAG 데이터 파이프라인 기술, 도메인 실증까지 전반의 기술 개발을 총괄 수행한다.

이 과제는 연구개발에 이어 의료(전남대학교병원), 법률(앤쌤), 제조(JB), 미디어 광고(SBSi) 등 다양한 도메인에서의 실증을 통해 각종 비즈니스 환경과 사용자 요구에 맞춘 현실 데이터로 검증하는 단계를 거칠 계획이다.

특히 그간 전통적인 제조분야의 산업현장, 반도체 공정 등에서 멀티모달 RAG 기술에 대한 필요성이 꾸준히 제기되어 왔던 만큼, 본 기술을 반영해 수요가 있는 다양한 분야에서 더욱 복잡하고 효율적인 작업을 수행 할 수 있게 실증사업을 진행할 예정이다.

강용성 와이즈넛 대표는 “향후 AI가 ‘인간처럼’ 사고하고 상호작용하기 위해서는 멀티모달 RAG 기술이 필수적”이라며 “와이즈넛은 이번 연구에서 멀티모달 RAG 기술을 통해 AI 기술 수준을 한 단계 업그레이드하고, 혁신적인 비즈니스 모델을 선제적으로 창출하는 기술적 토대를 마련할 것”이라고 말했다.

강동식 기자 lavita@datanews.co.kr

[ⓒ데이터저널리즘의 중심 데이터뉴스 - 무단전재 & 재배포 금지]

맨 위로