인공지능(AI) 소프트웨어 전문기업 코난테크놀로지(대표 김영섬)는 자체 개발한 대형언어모델 ‘코난 LLM’이 미국 스탠퍼드대 ‘에코시스템 그래프’에 이름을 올리고, 비즈니스 라인업도 새롭게 재정비했다고 31일 밝혔다.
에코시스템 그래프는 스탠퍼드대 기초모델연구센터(CRFM)가 세계 AI 모델, 데이터 셋, 응용프로그램의 사회적 영향력을 분석하는 프로젝트다.
코난 LLM은 지난 28일 에코시스템 그래프에 추가됐다. 등록된 정보에 따르면, ‘코난 LLM은 코난테크놀로지에서 자체 개발한 대규모 언어 모델입니다. 초대형 AI 학습에 최적화된 이 모델은 고품질의 대규모 데이터와 자연어 처리 분야에서 20년 이상 쌓아온 전문성을 활용합니다’라고 소개됐다.
코난테크놀로지는 자체 데이터와 컴퓨팅 인프라를 기반으로 지난해 8월 코난LLM 파운데이션 모델을 출시했다. 한국의 토종 생성형 AI로, 통상 AI 모델은 한국에서 생산된 데이터를 얼마나 갖고 학습했는지에 따라 한국어 성능이 결정된다.
코난 LLM의 전체 학습 토큰 수는 47B 모델 기준 1조5111억개, 한국어 토큰수는 5111억 개에 달한다. 2007년부터 시작한 온라인 미디어 심화 분석 펄스케이(pulseK)를 통해 확보한 데이터가 현재 250억 건 규모다. 한국어 토큰의 규모 뿐만 아니라 한국의 문화, 정서, 라이프스타일 등이 담긴 데이터로 학습한 만큼 한국어 답변 품질도 뛰어나다.
한편, 코난테크놀로지는 최근 STT, TTS, LLM 기능을 갤럭시 S24에 동시 탑재해 실시간 외국어 대화를 구현했다. 퀄컴의 스냅드래곤 등 저전력의 AI칩에서 작동된 만큼 ▲스마트폰 ▲카메라 ▲센서 ▲드론 ▲웨어러블 등 여러 디바이스에도 적용이 가능하다.
코난테크놀로지는 기업용 코난 LLM 모델 라인업도 재정비했다. 기존의 파라미터 기준 분류에서 ▲온디바이스(OND) ▲단위업무 규모용(PRO) ▲전사업무 규모용(ENT)로 구분했다.
생성형 AI 도입을 고민하는 기업에게 원하는 업무의 규모나 용도 및 예산에 맞춰 선택 폭을 넓히겠다는 방침이다. 현재 코난 LLM은 14B와 47B 그리고 온디바이스용 4B와 7B 모델이 개발돼 있다.
김영섬 코난테크놀로지 대표는 “현지 데이터와 컴퓨팅 인프라, 자체 엔진이 가진 특성을 승부처로 삼아 기업의 인공지능 비즈니스를 돕고, 매출 확대에도 속도를 내겠다”고 말했다.
김민지 기자 honest@datanews.co.kr
[ⓒ데이터저널리즘의 중심 데이터뉴스 - 무단전재 & 재배포 금지]