
투데이e코노믹 = 유서진 기자 | SK텔레콤이 시각·언어 통합 인공지능(VLM) 기술과 문서 해석 기반 거대언어모델(LLM) 기술을 오픈소스로 공개하며, 한국어 기반 멀티모달 AI 경쟁력에서 글로벌 선두권에 올라섰다.
SK텔레콤은 29일, 자사의 AI 모델 ‘에이닷 엑스(A.X)’ 기반의 시각-언어모델 ‘A.X 4.0 VL 라이트’와 문서 해석 기술 ‘A.X 인코더’를 글로벌 오픈소스 플랫폼 허깅페이스(Hugging Face)를 통해 공개했다고 밝혔다.
‘A.X 4.0 VL 라이트’는 표, 그래프, 설계도면 등 다양한 산업 문서를 이해할 수 있도록 멀티모달 한국어 데이터셋으로 학습된 중형 모델로, 시각 정보와 언어 정보를 동시에 처리할 수 있는 VLM(Vision-Language Model) 기술을 탑재하고 있다. 이번 모델은 한국어 시각 AI 벤치마크에서 평균 79.4점을 기록해, 중국의 ‘큐원 2.5-VL32B’보다 우수한 성능을 보였다.
또한, SK텔레콤은 A.X 시리즈 모델의 처리 속도와 효율을 끌어올리기 위해 자체 개발한 문서 해석용 ‘A.X 인코더’도 함께 공개했다. 이 인코더는 기존 대비 최대 3배 빠른 추론 속도와 2배 빠른 학습 속도를 실현했으며, 1억 4,900만 개의 파라미터를 기반으로 자연어 이해(NLU) 지표 평균 85.47점을 달성, 사실상 글로벌 최고 수준(SOTA: State of the Art)의 성능을 입증했다.
이로써 SK텔레콤은 이번에 추가로 2종의 AI 기술을 더하면서 총 6종의 A.X 모델을 공개하게 됐다. 이는 산업 현장에 특화된 실용적 AI 솔루션을 제공하기 위한 전략의 일환으로, 기업용 AI 서비스 고도화에 직접적인 기여를 할 전망이다.
김태윤 SK텔레콤 파운데이션 모델 담당은 “AI 주권 확보를 위해선 독자적인 기술력 축적이 무엇보다 중요하다”며 “SKT는 국내외 컨소시엄과의 협력을 강화하는 동시에 독자모델의 완성도를 높여 글로벌 AI 경쟁력을 선도하겠다”고 말했다.
SK텔레콤은 앞으로도 AI 모델을 지속적으로 오픈소스로 공개하며, AI 생태계 확대 및 국내 AI 기술의 글로벌 진출 기반을 넓혀간다는 계획이다.