• 흐림동두천 1.0℃
  • 흐림강릉 1.3℃
  • 서울 3.2℃
  • 대전 3.3℃
  • 대구 6.8℃
  • 울산 6.6℃
  • 광주 8.3℃
  • 부산 7.7℃
  • 흐림고창 6.7℃
  • 흐림제주 10.7℃
  • 흐림강화 2.2℃
  • 흐림보은 3.2℃
  • 흐림금산 4.4℃
  • 흐림강진군 8.7℃
  • 흐림경주시 6.7℃
  • 흐림거제 8.0℃
기상청 제공

AI platform

인간 뇌 닮은 ‘초거대 AI’ 투자 러시…왜?

초거대 AI, 데이터 폭넓게 이해하기에 기존 AI 할 수 없었던 종합적 추론 능력 갖춰
LG, 250년간 논문과 특허 분석한 데이터베이스 구축 차세대 배터리 소재 발굴 계획
네이버, 현존 최고 성능 GPT-3 능가한 한국어, 일본어 초거대 언어모델 구축 목표

URL복사

[투데이e코노믹 = 우혜정 기자] LG, 네이버 등 국내 기업이 인간의 뇌를 닮은 ‘초거대 인공지능(AI)’ 구축에 열을 올리고 있다.

 

초거대 AI는 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 학습해 종합적이고 자율적으로 사고·학습·판단·행동하는 인간의 뇌 구조를 닮은 AI다.

 

LG AI 연구원은 17일 소프트웨어(SW)개발, 데이터 분석, 소비자 상담 등 각 분야의 ‘상위 1% 인간 전문가’ 수준의 역량을 보유한 ‘초거대 AI’ 개발에 1억 달러 이상을 투자하겠다고 밝혔다. 한화 1130억 원 수준이다.

 

LG AI 연구원은 이날 오전 비대면 방식으로 진행된 ‘AI’ 토크 콘서트에서 이같이 밝혔다. 향후 3년간 방대한 데이터를 빠르게 처리할 수 있는 대규모 컴퓨팅 인프라 확보와 개발에 나설 예정이다.

 

 

 

LG가 올해 하반기에 공개할 초거대 AI는 무려 6000억 개의 파라미터를 장착한다. 현재 가장 뛰어난 초거대 AI 언어 모델인 GPT-3는 1750억 개의 파라미터를 갖추고 있는데, 이의 3배 수준인 셈이다. 

 

이에 그치지 않고 내년 상반기에는 조 단위 파라미터의 초거대 AI를 개발할 예정이다. 이 같은 규모의 초거대 AI 개발 목표를 밝힌 것은 LG가 글로벌 업체 중 처음이다.

 

파라미터란 인간의 뇌에서 뉴런을 연결해 정보를 학습하고 기억하는 역할을 담당하는 ‘시냅스’와 유사한 역할을 한다. 이 파라미터가 많을수록 AI 성능은 정교해진다. 인간 뇌의 시냅스는 수십조~100조 개로 알려져 있다. 

 

LG가 공개할 초거대 AI는 언어뿐만 아니라 이미지와 영상을 이해하고, 데이터 추론까지 가능할 전망이다. SW개발, 데이터 분석, 고객 상담 등 다양한 분야에서 활용 가능하다.

 

예컨대 초거대AI로 고객별 상담이력을 요약해주는 ‘가상 어드바이저’를 구현, 상담사가 고객의 개인별 상황에 맞게 서비스를 제공할 수 있도록 돕는다. 소프트웨어 코딩을 맡겨 제품 개발 프로세스를 획기적으로 단축할 수도 있다. 

 

또 LG는 250년간의 화학 분야 논문과 특허를 분석한 데이터베이스를 구축, 초거대 AI를 활용해 차세대 배터리 소재를 발굴할 계획이다. 인간의 면역 체계를 활용한 항암 백신 개발에도 나선다. ‘창조적 초거대 AI’를 통해 디자인 분야에서도 상품 설계 등 활용이 가능하다.

 

네이버도 초거대 AI 개발을 진행 중이다. 지난해 10월 네이버는 미국의 ‘오픈AI’가 개발한 현존하는 최고의 초거대 AI 언어모델 GPT-3를 능가한 한국어, 일본어 초거대 언어모델을 만든다는 목표를 밝힌 바 있다. 이를 위해 국내 기업 최초로 슈퍼컴퓨터도 도입했다.

 

이달 10일에는 서울대학교와 초거대 AI 공동연구를 위한 협약을 온라인으로 체결하고 ‘서울대-네이버 초대규모 AI 연구센터’를 설립한다고 밝혔다. 네이버와 서울대의 연구원 100명이 참여하고, 3년간 연구비를 포함해 수백억원 규모의 투자를 진행하기로 했다. 

 

연구공동체는 초거대 한국어 언어모델을 만드는데 주력한다. 언어·이미지·음성을 동시에 이해하는 초대규모 AI를 함께 개발해, 글로벌 AI 기술을 선도하는 것이 목표다. 

 

오는 25일에는 온라인으로 ‘네이버 AI NOW’ 행사를 개최, 네이버의 초거대 AI 모델을 최초로 공개할 예정이다. 특히 내년 하반기 슈퍼컴퓨터 도입 이후의 진행 상황과 성과 등을 공유한다.
 

 

왜 '초거대 AI' 인가?

 

기존 AI는 특정 작업만 수행할 수 있다. 법률 관련 정보를 학습했다면 법률 관련 질문에만 답할 수 있는 식이다. 이 AI가 의학 관련 질문에 답하려면 의학 관련 정보를 추가로 학습해야 한다. 

 

또한 이러한 정보를 학습할 때는 일일이 라벨링이 완료된 데이터가 필요하다. 이 작업을 하는 데에 막대한 시간과 노동력이 들어간다. 일례로 글로벌 컨설팅 업체 엑센츄어는 1시간 동안 수집한 자율주행 프로젝트 데이터를 라벨링하는데 약 800시간이 필요할 것이라고 예측한 바 있다. 

 

반면 초거대 AI는 사전 학습 시 데이터에 대한 별도의 레이블링 작업이 필요 없으며, 추가 학습에 들어가는 시간을 대폭 줄일 수 있어 효율적이다. 

 

초거대 AI는 데이터를 폭넓게 이해하기 때문에 기존 AI는 할 수 없었던 종합적인 추론을 해낸다. 인간의 뇌와 비슷한 사고가 가능해지는 셈이다. 더 나아가 창작 활동도 해낸다. 

 

GPT-3의 경우 크롤링 4100억 개, 웹텍스트 190억 개, 책1 120억 개, 책2 550억 개, 위키피디아 30억 개 등 초대규모 데이터셋을 활용했다. 이를 통해 단일 문장이 아닌 대화의 문맥을 파악해 창의적인 답변을 내놓는 수준까지 도달했으며, 인간과 비슷한 수준으로 뉴스 기사를 작성할 수도 있게 됐다. 

 

또한 초거대 AI는 특정 용도에 한정되지 않으므로 다양한 응용서비스 개발에 활용될 수 있다. 즉 단일 모델을 플랫폼처럼 활용할 수 있게 되는 것이다. GPT-3는 언어모델을 무료로 공개하는 대신 유료 API 서비스를 시작했다.