오는 21일 정부의 '독자 AI 파운데이션 모델' 프로젝트 공모 마감을 앞두고 최근 국내 기업들이 잇따라 차세대 거대언어모델(LLM)을 선보이고 있는 가운데 NC AI도 새로운 무기를 앞세워 기술 경쟁력 과시에 나섰다.
NC AI는 16일 한국어 기반 멀티모달 인공지능(AI) 기술력을 집약한 '바르코-비전(VARCO-VISION) 2.0'을 오픈소스로 공개했다. 14B와 1.7B, 1.7B OCR, 비디오-임베딩(Video-Embedding) 등 총 4종으로 구성됐으며 14B와 임베딩 모델 2종은 이날, 1.7B와 OCR모델은 차주 중 공개 예정이다.
NC AI 관계자는 "최고 수준의 한국어 성능을 바탕으로 이미지와 텍스트를 함께 이해하는 능력을 갖춘 차세대 인공지능 모델을 이번에 선보이게 됐다"며 "파운데이션 모델 구축이라는 측면에서 국내에서 수백억 파라미터 이상의 모델을 프롬 스크래치(From Scratch·모델의 첫 단계부터 모두 직접 구축) 방식으로 해 본 경험이 있는 몇 안되는 AI 기업이라고 자부한다"고 강조했다.
(이미지=NC AI)
바르코-비전 2.0 14B는 이미지와 텍스트를 함께 이해해 질문에 답할 수 있는 차세대 인공지능 모델이다. 복잡한 문서, 표, 차트의 동시 분석은 물론 한국어·영어 이중 언어 처리 능력까지 강화된 것이 특징으로, 글로벌 오픈소스 VLM(비전언어모델) 최고 성능으로 알려진 인턴VL3-14B(InternVL3-14B, 140억 파라미터)와 알리바바의 오비스(Ovis)2-16B, 큐원(Qwen)2.5-VL 7B를 능가하는 성과를 달성했다.
1.7B 모델은 스마트폰이나 PC 등 개인 기기에서도 원활하게 동작할 수 있도록 경량 구조로 설계됐다. 이미지 내 문자를 인식하는 광학 문자 인식 작업에 특화된 모델인 바르코-비전-1.7B-OCR은 애니레스(AnyRes) 해상도 분할 입력 방식을 적용해 고해상도 정보 처리와 함께 한국어-영어 혼합 환경에서도 높은 인식 정확도를 보였다.
바르코-비전-임베딩 모델은 텍스트, 이미지, 비디오 간의 의미적 유사도를 정밀하게 계산해 검색 정확도를 높였으며 비디오 검색 벤치마크(MultiVENT2.0)에서도 우수한 성능을 보여줬다.
이번에 공개된 4종의 모델은 금융, 교육, 문화, 쇼핑, 제조 등 다양한 도메인에서 활용 가능하다. NC AI는 이번 모델 발표로 파운데이션 모델을 기반부터 구축하는 프롬 스크래치 방식의 LLM 모델 개발 경험에 더해 멀티모달 모델 구축 능력까지 갖춘 독자 AI 기술력을 드러냈다는 평가를 받는다.
업계 관계자는 "NC AI의 이번 발표는 한국어 특화 모델의 경쟁력을 입증한 것으로 보인다"며 "정부가 추진 중인 '소버린 AI' 전략에 본격적인 기술 파트너로 NC AI가 나서겠다는 의지를 보여준 것으로 보인다"고 말했다.

관련기사
- 민주당, 김홍일 방통위원장 탄핵 추진..."6월내 통과 목표"2024.06.27
- 김홍일 위원장 "2인 체제 방통위, 바람직하지 않지만 위법 아니다”2024.06.21
- LG 구광모 6년...AI·바이오·클린테크 키운다2024.06.28
- 화재 막는 배터리 진단기술 뜬다...민테크, 상장 후 존재감 '쑥쑥'2024.06.28