• 맑음동두천 -8.5℃
  • 맑음강릉 -2.1℃
  • 맑음서울 -5.2℃
  • 맑음대전 -2.7℃
  • 맑음대구 -1.1℃
  • 맑음울산 -0.1℃
  • 광주 0.3℃
  • 맑음부산 1.1℃
  • 흐림고창 -1.9℃
  • 흐림제주 6.8℃
  • 맑음강화 -5.8℃
  • 맑음보은 -5.3℃
  • 맑음금산 -3.2℃
  • 구름조금강진군 2.3℃
  • 맑음경주시 -0.6℃
  • 맑음거제 2.4℃
기상청 제공

AI platform

챗GPT-5 개발 한계 맞았나...데이터 부족에 출시 지연

18개월 넘게 대규모 훈련했지만 난관 봉착
6개월간 비용 7200억원 이상 소요 추정

URL복사

투데이e코노믹 = 우혜정 기자 | 챗GPT 개발사 오픈AI의 새 인공지능(AI) 모델 개발이 지연되고 있다. 데이터 부족으로 AI 모델 성능 향상이 한계에 봉착했다는 평가가 나온다.

 

지난 22일(현지시간) 월스트리트저널(WSJ)에 따르면 코드명 '오리온(Orion)'으로 알려진 오픈AI의 차세대 AI 모델 GPT-5 개발이 기약 없이 지연되고 있다. 오픈AI의 최대 투자사인 마이크로소프트(MS)는 올해 중반 새 모델 출시를 기대한 것으로 전해진다.


오픈AI는 지금까지 18개월 넘게 방대한 양의 데이터를 처리하는 대규모 훈련을 최소 2차례 진행했지만 여러 문제들이 발생하면서 예상한 결과를 얻지 못했다.


WSJ는 새 모델이 기존 GPT-4보다는 성능이 향상됐지만 막대한 비용을 정당화할 만큼 충분하지는 않다고 보도했다.


업계에서는 이와 같은 대규모 AI 훈련에 6개월간 컴퓨팅 비용만으로 약 5억달러(약 7247억5000만원)가 들었을 것으로 추정하고 있다.

 

"컴퓨터 연산 능력은 향상하지만 데이터는 늘지 않아"

 


AI 모델 개발에 최대 난관은 데이터 부족인 것으로 알려졌다. 오픈AI는 이전 모델의 경우 인터넷에서 수집한 뉴스 기사나 소셜미디어 게시물, 과학 논문 등을 AI 훈련에 사용했다. 그러나 새 모델을 더 지능적으로 발전시키기 위해 필요한 양질의 데이터는 그만큼 충분하지 않다는 것이다.


이 문제를 해결하기 위해 오픈AI는 소프트웨어 엔지니어나 수학자들을 고용해 새로운 소프트웨어 코드를 만들거나 복잡한 수학 문제를 풀도록록 하는 등 직접 새로운 데이터를 생성하는 방식을 도입했다. 하지만 이 과정은 기존 방식보다 훨씬 많은 시간이 소요된다.


또 수백만달러를 제시하며 오픈AI의 최고 연구원을 빼가려는 경쟁사들의 시도가 지속되고 있어 인건비 등 비용 부담도 커지고 있는 상황이다.


오픈AI 공동 창립자였던 일리야 수츠케버는 지난 13일 한 강연에서 “컴퓨터 연산 능력은 향상하고 있지만, 데이터는 늘지 않고 있다”며 “우리가 가진 인터넷은 오직 하나뿐이기 때문”이라고 밝혔다.