
투데이e코노믹 = 유서진 기자 | KT가 한국적 특성을 깊이 반영한 자체 개발 AI 모델 ‘믿:음 2.0’을 선보이며, 국내 AI 시장 대중화에 속도를 내고 있다.
KT는 3일, 자사가 독자적으로 개발한 대규모 언어모델(LLM) ‘믿:음 2.0’을 AI 개발자 플랫폼 허깅페이스(HuggingFace)를 통해 오픈소스로 공개할 계획이라고 밝혔다. 기업과 개인, 공공 누구나 상업적으로 제약 없이 활용할 수 있도록 개방, 한국형 AI 생태계 확산을 본격적으로 추진하겠다는 구상이다.
‘믿:음’은 한국어 고유의 언어적·문화적 특성과 사회적 맥락을 학습한 KT의 한국형 AI 모델이다. 지난해 출시된 1.0 버전은 KT의 AI 고객센터(AICC), 지니TV, AI 전화, 100번 고객센터 등에서 활용되며 이미 상용화 기반을 다졌다.
이번에 공개되는 2.0 모델은 115억 파라미터의 ‘베이스(Base)’와 23억 파라미터 규모의 ‘미니(Mini)’ 두 가지로, 한국어와 영어를 모두 지원한다. KT에 따르면 베이스 모델은 문서 기반 질의응답 등에서 한국 특화 지식을 바탕으로 강력한 성능을 발휘하며, 미니 모델은 이를 압축 학습해 경량화한 버전이다.
특히 KT는 이번 모델 학습에 국내 교육용 도서, 문학 작품, 법률·특허 문서, 각종 사전 등 방대한 한국 특화 데이터를 활용했다. 저작권 문제가 있는 데이터는 사전에 제거하는 등 ‘리스폰서블 AI’ 원칙을 따랐으며, 고려대 민족문화연구원과 산학 협력, 자체 토크나이저 개발 등을 통해 한국어 구조와 문화적 맥락을 정밀하게 반영했다고 설명했다.
KT는 또한 AI 윤리와 신뢰성을 높이기 위해 국내외 AI 가이드라인을 참고해 전문가들과 함께 마련한 ‘AI 영향 평가 체계’를 이번 모델에 적용했다.
신동훈 KT 생성형AI랩장(CAIO) 상무는 “믿:음 2.0은 단순히 생성 능력만 뛰어난 것이 아니라 한국의 문화와 언어를 깊이 이해하도록 설계된 고도화된 AI”라며 “이는 국내 사용자들에게 한국형 고성능 AI라는 새로운 대안을 제공함과 동시에 글로벌 시장에서도 경쟁력을 갖출 수 있는 중요한 발판이 될 것”이라고 강조했다.
KT는 앞서 마이크로소프트(MS)와 전략적 파트너십을 체결, GPT-4에 한국적 사고를 추가 학습시키는 방식의 모델을 준비 중이며 이를 순차적으로 공개할 계획이다. KT 관계자는 “글로벌 최고 수준(SOTA) AI와 믿:음 시리즈를 결합해 한국의 특수성을 제대로 담은 AI를 계속 선보일 것”이라고 말했다.