KT "정부 독자 AI모델 프로젝트 참여...한국적 AI 자체개발"

KT가 한국어에 최적화된 대규모 언어모델(LLM) ‘믿:음 2.0’을 공개하고, 오픈소스 생태계 확장과 정부 AI 프로젝트 참여 의지를 밝혔다.

KT는 3일 진행된 온라인 브리핑에서 한국적 가치와 문화, 언어 특성을 반영한 ‘믿음 2.0’을 공개하고, B2B 활용 중심의 한국형 AI 전략을 설명했다.

신동훈 KT Gen Al 랩장은 “KT는 AI의 모든 영역에 데이터 주권, 사용자 선택권, 한국적 가치, 책임 있는 운영이라는 네 가지 원칙을 담고자 한다”며 “믿:음 2.0은 이러한 소버린 AI 철학을 바탕으로 개발된 첫 모델”이라고 말했다.

이어, “KT의 AI 철학과 방향이 맞기 때문에 독자 AI 파운데이션 모델 프로젝트에 참여하려고 준비하고 있다”며 “지난 1년간 한국적인 가치와 문화를 담아내기 위해 데이터얼라이언스와 노력·구축한 모델은 독자적 AI 구축에 큰 강점이라 생각한다”고 밝혔다.

이번에 공개된 ‘믿:음 2.0’은 한국어 표현과 문맥에 특화된 LLM으로 ▲문서 기반 검색(QA) ▲보고서 요약 및 작성 ▲툴 호출 등 기업 환경에서 자주 쓰이는 업무에 맞춰 최적화했다. 특히 한국어에 맞춰 문장을 잘게 나누는 전용 도구(토크나이저)와 분야(도메인)별로 정리된 고품질 데이터를 함께 적용해 한국의 말투와 문화, 감정 표현까지 자연스럽게 이해할 수 있도록 설계됐다.

KT는 믿:음 2.0을 경량형 ‘미니’와 중간급 ‘베이스’ 모델로 나눠 공개하며, 누구나 자유롭게 상업용으로도 활용할 수 있도록 MIT 라이선스를 적용했다. 대형 모델인 ‘프로’는 향후 단계적으로 공개될 예정이다. 모든 모델은 KT의 자체 기술로 처음부터 끝까지 독자적으로 학습된 것이 특징이다.

아울러 정부가 추진 중인 ‘독자 AI 파운데이션 모델’ 구축 사업에도 참여할 계획이다. 오픈소스 LLM 생태계 확대와 동시에 공공·금융 등 다양한 산업 분야에 맞춤형 솔루션을 제공하며 AI 활용 저변을 넓히겠다는 전략이다.

사진=KT intelligence 홈페이지

신 상무는 “한국형 AI 모델 개발에 가장 중요한 것은 양질의 한국어 데이터”라며 “KT는 ‘K-데이터 얼라이언스’를 통해 각 분야 대표 기업·기관과 협력하며 국내 최고 수준의 데이터를 확보하고 있다”고 말했다.

이어 “공공 문서 등 고품질 국가 데이터가 AI 학습에 활용될 수 있도록 제도적 지원도 필요하다”고 덧붙였다.