챗GPT-5 개발 한계 맞았나...데이터 부족에 출시 지연

  • 등록 2024.12.25 18:42:31
크게보기

18개월 넘게 대규모 훈련했지만 난관 봉착
6개월간 비용 7200억원 이상 소요 추정

투데이e코노믹 = 우혜정 기자 | 챗GPT 개발사 오픈AI의 새 인공지능(AI) 모델 개발이 지연되고 있다. 데이터 부족으로 AI 모델 성능 향상이 한계에 봉착했다는 평가가 나온다.

 

지난 22일(현지시간) 월스트리트저널(WSJ)에 따르면 코드명 '오리온(Orion)'으로 알려진 오픈AI의 차세대 AI 모델 GPT-5 개발이 기약 없이 지연되고 있다. 오픈AI의 최대 투자사인 마이크로소프트(MS)는 올해 중반 새 모델 출시를 기대한 것으로 전해진다.


오픈AI는 지금까지 18개월 넘게 방대한 양의 데이터를 처리하는 대규모 훈련을 최소 2차례 진행했지만 여러 문제들이 발생하면서 예상한 결과를 얻지 못했다.


WSJ는 새 모델이 기존 GPT-4보다는 성능이 향상됐지만 막대한 비용을 정당화할 만큼 충분하지는 않다고 보도했다.


업계에서는 이와 같은 대규모 AI 훈련에 6개월간 컴퓨팅 비용만으로 약 5억달러(약 7247억5000만원)가 들었을 것으로 추정하고 있다.

 

"컴퓨터 연산 능력은 향상하지만 데이터는 늘지 않아"

 


AI 모델 개발에 최대 난관은 데이터 부족인 것으로 알려졌다. 오픈AI는 이전 모델의 경우 인터넷에서 수집한 뉴스 기사나 소셜미디어 게시물, 과학 논문 등을 AI 훈련에 사용했다. 그러나 새 모델을 더 지능적으로 발전시키기 위해 필요한 양질의 데이터는 그만큼 충분하지 않다는 것이다.


이 문제를 해결하기 위해 오픈AI는 소프트웨어 엔지니어나 수학자들을 고용해 새로운 소프트웨어 코드를 만들거나 복잡한 수학 문제를 풀도록록 하는 등 직접 새로운 데이터를 생성하는 방식을 도입했다. 하지만 이 과정은 기존 방식보다 훨씬 많은 시간이 소요된다.


또 수백만달러를 제시하며 오픈AI의 최고 연구원을 빼가려는 경쟁사들의 시도가 지속되고 있어 인건비 등 비용 부담도 커지고 있는 상황이다.


오픈AI 공동 창립자였던 일리야 수츠케버는 지난 13일 한 강연에서 “컴퓨터 연산 능력은 향상하고 있지만, 데이터는 늘지 않고 있다”며 “우리가 가진 인터넷은 오직 하나뿐이기 때문”이라고 밝혔다.

우혜정 기자 wclefnote@todayeconomic.com
Copyright @2020 투데이e코노믹 Corp. All rights reserved.




제호 : 투데이e코노믹 | 서울특별시 강서구 강서로 385, 8층 804-27호(마곡동, 우성에스비타워) 등록번호 : 서울,아52937 | 등록일/발행일 : 2020년 3월 9일 | 발행인/편집인 : 박재형 | 전화번호 : 010-2491-8008 | 운영사 : JH미디어 | 전화번호 : 070-4045-5491 Copyright ©2020 투데이e코노믹. All rights reserved. 「열린보도원칙」 본 매체는 독자와 취재원 등 뉴스이용자의 권리 보장을 위해 반론이나 정정보도, 추후보도를 요청할 수 있는 창구를 열어두고 있음을 알려드립니다. 고충처리인 l 우혜진 070-4045-5491 l wh5222@todayeconomic.com