업스테이지, 프롬 스크래치 방식으로 딥시크 넘었다

‘솔라 오픈 100B’ 공개…딥시크 R1, 오픈AI ‘GPT-OSS-120B’ 등 글로벌 경쟁 모델 성능 추월

  • 카카오공유 
  • 메타공유 
  • X공유 
  • 네이버밴드 공유 
  • 프린트
  • 메일
  • 스크랩
  • 목록
  • 글자크기
  • 크게
  • 작게
업스테이지, 프롬 스크래치 방식으로 딥시크 넘었다
인공지능(AI) 기술 기업 업스테이지(대표 김성훈)는 자체 개발한 대규모언어모델(LLM) ‘솔라 오픈 100B’를 오픈소스로 공개했다고 6일 밝혔다.

솔라 오픈은 업스테이지가 주관사로 참여 중인 과학기술정보통신부의 ‘독자 AI 파운데이션 모델 프로젝트’의 첫 번째 결과물이다. 데이터 구축부터 학습에 이르는 과정 전반을 독자적으로 수행하는 ‘프롬 스크래치’ 방식으로 개발했다.

업스테이지는 해당 모델을 글로벌 오픈소스 플랫폼 ‘허깅페이스’에 공개하는 한편, 개발 과정과 기술적 세부 내용을 담은 테크 리포트도 함께 발표했다.

1020억 매개변수 모델인 솔라 오픈은 성능 면에서 글로벌 프런티어급 모델들과 어깨를 나란히 했다. 중국의 대표 AI 모델인 ‘딥시크 R1(DeepSeek R1-0528-671B)’ 대비 사이즈는 15%에 불과하지만, 한국어(110%), 영어(103%), 일본어(106%) 등 3개 국어 주요 벤치마크 평가에서 이를 상회하는 성과를 거뒀다.

특히 한국어 능력은 압도적이다. 한국 문화 이해도(Hae-Rae v1.1), 한국어 지식(CLIcK) 등 주요 한국어 벤치마크 결과 딥시크 R1 대비 2배 이상의 성능 격차를 보였으며, 오픈AI의 유사 규모 모델인 ‘GPT-OSS-120B-Medium’과 비교해서도 100% 앞선 성능을 기록했다.

수학, 복합 지시 수행, 에이전트 등 고차원적 지식 영역에서도 딥시크 R1과 대등한 성능을 확보했다. 오픈AI GPT-OSS-120B-Medium과 비교해서도 종합 지식과 코드 작성 능력 등에서 대등한 경쟁력을 보였다.

업스테이지, 프롬 스크래치 방식으로 딥시크 넘었다

▲솔라오픈 100B 벤치마킹 결과 / 자료=업스테이지


회사 측은 약 20조 토큰 규모의 고품질 사전학습 데이터셋이 주효했다고 설명했다. 업스테이지는 대표적 ‘저자원 언어’인 한국어 데이터 부족을 극복하고자 다양한 합성 데이터와 금융·법률·의학 등 분야별 특화 데이터 등을 학습에 활용하고, 다양한 데이터 학습 및 필터링 방법론을 고도화했다.

향후 업스테이지는 해당 데이터셋의 일부를 한국지능정보사회진흥원(NIA)의 ‘AI 허브’를 통해 개방해 국내 AI 연구 생태계 활성화를 위한 공공재로 환원할 예정이다. 

솔라 오픈은 129개의 전문가 모델을 혼합한 ‘MoE(Mixture-of-Experts)’ 구조를 통해 실제 연산에는 120억 개 매개변수만 활성화하는 방식으로 효율을 극대화했다. 또 GPU 최적화를 통해 초당 토큰 처리량(TPS)을 약 80% 향상시키고, 자체 강화학습(RL) 프레임워크 ‘스냅PO(SnapPO)’를 개발해 학습 기간을 50% 단축했다. 이를 통해 약 120억 원에 달하는 GPU 인프라 비용 절감 효과를 거뒀다.

솔라 오픈의 기술력은 국제적으로도 인정받았다. 미국 비영리 연구기관 에포크AI(Epoch AI)가 발표하고 스탠퍼드대 HAI(인간중심 AI 연구소) 보고서에 활용되는 ‘주목할 만한 AI 모델(Notable AI Models)’ 리스트에 이름을 올리며, 한국이 글로벌 AI 3강으로 도약할 기술적 교두보를 마련했다는 평이다.

업스테이지는 컨소시엄 정예팀으로 참여 중인 ▲노타 ▲래블업 ▲플리토 ▲한국과학기술원(KAIST) ▲서강대학교 등과 기술력을 결집했으며, 향후 ‘AI로 여는 일의 표준’을 목표로 산업별 특화 서비스 개발에 박차를 가할 예정이다. ▲금융결제원(금융) ▲로앤컴퍼니(법률) ▲마키나락스(국방·제조) ▲뷰노(의료) ▲오케스트로(공공) ▲데이원컴퍼니(교육) 등 각 분야 대표 기업들과 협력해 AX(AI 전환)를 가속화할 방침이다. 또 올거나이즈(글로벌) 및 업스테이지 미국·일본 지사를 통해 글로벌 시장 공략도 확대한다.

이밖에도 230만 사용자를 보유한 ‘AskUp’과 업무 지원 서비스 ‘AI 워크스페이스’ 등에 솔라 오픈을 적용해 민간과 공공 전반으로 활용성을 넓혀갈 계획이다. 또 업스테이지 자체 플랫폼인 ‘업스테이지 콘솔’을 통해 응용프로그램인터페이스(API)를 배포해 더 많은 개발자가 사용할 수 있도록 할 방침이다.

김성훈 업스테이지 대표는 “솔라 오픈은 업스테이지가 처음부터 독자적으로 학습해 낸 모델로, 한국의 정서와 언어적 맥락을 깊이 이해하는 ‘가장 한국적이면서도 세계적인 AI’”라며 “솔라 오픈 공개가 한국형 프런티어 AI 시대를 여는 중요한 전환점이 될 것”이라고 말했다.

강동식 기자 lavita@datanews.co.kr