• 흐림동두천 1.0℃
  • 흐림강릉 1.3℃
  • 서울 3.2℃
  • 대전 3.3℃
  • 대구 6.8℃
  • 울산 6.6℃
  • 광주 8.3℃
  • 부산 7.7℃
  • 흐림고창 6.7℃
  • 흐림제주 10.7℃
  • 흐림강화 2.2℃
  • 흐림보은 3.2℃
  • 흐림금산 4.4℃
  • 흐림강진군 8.7℃
  • 흐림경주시 6.7℃
  • 흐림거제 8.0℃
기상청 제공

AI platform

LG, 초거대AI ‘엑사원 2.0’ 공개

문헌 4500만 건·이미지 3억5000만 장 학습

URL복사

 

투데이e코노믹 = 박재형 기자 | LG가 신소재, 신물질, 신약 등의 개발에 활용할 수 있는 초거대 인공지능(AI) ‘엑사원(EXAONE) 2.0’을 선보였다.

 

LG AI연구원은 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 ‘LG AI 토크 콘서트 2023’을 열고 엑사원 2.0을 공개했다.

 

LG AI연구원은 2021년 12월 첫 선을 보인 ‘엑사원’의 진화한 모습을 소개했다.

 

LG AI연구원이 2021년 12월 첫 선을 보인 ‘엑사원’은 LG 계열사와 국내외 파트너사들이 보다 빠르고 편리하게 각 분야에 특화된 전문가 AI를 사용할 수 있도록 연구개발을 이어왔다.

 

이번에 공개한 ‘엑사원 2.0’은 파트너십을 통해 확보한 특허, 논문 등 약 4500만 건의 전문 문헌과 3억5000만 장의 이미지를 학습했다. LG AI연구원은 앞으로도 저작권, 신뢰성 등 AI 윤리원칙을 준수하며 데이터 학습을 진행할 계획이다.

 

LG AI연구원은 현존하는 전문 지식 데이터의 상당수가 영어로 되어 있는 점을 고려해 ‘엑사원 2.0’을 한국어와 영어를 동시에 이해하고 답변할 수 있는 이중 언어(Bilingual) 모델로 개발했고, 학습 데이터양도 기존 모델 대비 4배 이상 늘려 성능을 높였다.

 

또 초거대 AI의 고비용 이슈를 해결하기 위해 대규모 언어 모델(LLM)과 멀티모달 모델의 경량화, 최적화 신기술에 상당한 리소스를 투입했다고 밝혔다.

 

LG AI연구원은 ‘엑사원 2.0’의 언어 모델은 기존 모델과 동일한 성능을 유지하면서도 추론(Inference) 처리 시간은 25% 단축하고, 메모리 사용량은 70% 줄여 비용을 약 78% 절감했다.

 

언어와 이미지 간의 양방향 생성이 가능한 멀티모달 모델은 이미지 생성 품질을 높이기 위해 기존 모델 대비 메모리 사용량을 2배 늘렸지만, 추론 처리 시간을 83% 단축해 약 66%의 비용 절감을 달성했다.

 

LG AI연구원은 고객들이 ‘엑사원 2.0’을 원하는 용도나 예산에 맞게 모델의 크기부터 종류(언어, 비전, 멀티모달), 사용 언어까지 맞춤형으로 설계할 수 있다고 설명했다.

 

LG AI연구원은 고객 데이터 보안을 위해 학습 과정을 미세 조정하는 파인 튜닝(Fine-Tuning)과, AI 인프라를 고객이 보유한 서버에 직접 설치하는 구축형(On-Premise) 및 사설 클라우드(Private Cloud) 방식도 지원한다.

 

LG AI연구원은 대표적인 엑사원 활용 사례로 LG전자의 AICC(AI Contact Center, AI 컨택 센터)를 소개했다. AICC는 고객과의 상담 내용을 실시간으로 분석·요약하고 상담 내용에 적합한 답변이나 콘텐츠를 제안한다.

 

LG AI연구원은 국내에서 시범 운영 중인 AICC를 하반기 중 정식 서비스로 전환할 예정이며, 내년부터 영어권 국가로 확대할 계획이다.

 

이날 연구원은 엑사원의 3대 플랫폼 ▲유니버스 ▲디스커버리 ▲아틀리에를 함께 소개했다.

 

엑사원 유니버스는 전문가용 대화형 AI 플랫폼이다. 전문성이 필요한 분야의 질문에 대해 근거에 기반한 정확한 답변을 생성한다.

 

사전 학습한 데이터는 물론 각 분야 최신 전문 데이터까지 포함해 근거를 찾아내며 추론한 답변을 제시한다.

 

엑사원 디스커버리는 화학·바이오 분야 발전을 앞당길 신소재·신물질·신약 개발 플랫폼이다.

 

멀티모달 AI 기술을 활용해 전문 문헌의 텍스트뿐 아니라 분자 구조, 수식, 차트, 테이블, 이미지 등 비텍스트 정보까지 데이터베이스화하는 기술을 적용했다.

 

AI와 대화하며 전문 문헌 검토, 소재 구조 설계, 소재 합성 예측까지 가능하며 연구개발 소요 시간을 40개월에서 5개월로 단축할 것으로 연구원은 예상했다.

 

엑사원 아틀리에는 이미지를 언어로 표현하고 언어를 이미지로 시각화하는 멀티모달 AI 플랫폼이다.

 

저작권을 확보한 이미지와 텍스트가 짝을 이룬 페어 데이터 3억5000만 장을 학습한 엑사원 2.0을 기반으로 이미지 생성과 이해에 특화한 기능을 제공한다.

 

연구원은 엑사원 유니버스·디스커버리·아틀리에 서비스를 LG 그룹 내 연구진 등을 대상으로 올해 3∼4분기에 시작할 예정이다.

 

배경훈 LG AI연구원장은 “LG는 국내에서 유일하게 이중 언어 모델과 양방향 멀티모달 모델을 모두 상용화한 기업이며, 세상의 지식을 이해하고 발견하는 상위 1%의 전문가 AI를 개발하고 있다”며 “국내외 파트너사와 협력을 통해 실질적인 성공 사례를 만들어가며 '다른 생성형 AI들과는 차별화된 고객 가치'를 창출하는 글로벌 경쟁력을 갖춘 AI 컴퍼니로 발전해 나갈 것”이라고 말했다.




배너

기획기사

배너
배너
배너
배너