• 맑음동두천 -12.1℃
  • 맑음강릉 -8.3℃
  • 맑음서울 -10.5℃
  • 구름조금대전 -7.2℃
  • 맑음대구 -7.3℃
  • 맑음울산 -6.2℃
  • 구름조금광주 -5.9℃
  • 맑음부산 -4.9℃
  • 흐림고창 -8.3℃
  • 제주 0.4℃
  • 맑음강화 -9.8℃
  • 구름많음보은 -10.7℃
  • 구름많음금산 -9.2℃
  • 구름많음강진군 -4.9℃
  • 맑음경주시 -7.4℃
  • 맑음거제 -4.5℃
기상청 제공

AI platform

"챗GPT보다 뛰어나다고?"...싸고 성능 좋은 중국 AI 화제

스타트업 '딥시크', 추론 특화모델 'R1' 출시
"정확도 챗GPT 앞서"...AI 모델 훈련 비용, 메타의 10분의 1

URL복사

투데이e코노믹 = 우혜정 기자 | 중국 인공지능(AI) 스타트업 '딥시크(Deepseek)'가 미국 정보기술(IT)의 중심인 실리콘밸리를 긴장시키고 있다. 저렴한 비용으로 미국의 AI 플랫폼에 필적할 성능을 선보였다는 소식이 전해져서다.

 

딥시크는 지난 20일 추론 특화 모델 ‘딥시크-R1’을 출시했다. 지난해 12월 공개한 모델 V3를 파인튜닝(미세조정)해 만들어진 모델이다.


회사는 이 모델이 오픈AI의 추론 모델 ‘o1’과 동등한 성능을 가졌으며, 미국 수학경시대회인 AIME 2024 벤치마크 테스트에서 79.8%의 정확도를 기록해 o1(79.2%)을 앞섰다고 밝혔다.


회사는 V3 기술보고서를 통해 사전연구와 실험을 제외하고 모델 훈련에 투입한 비용이 557만6000달러(약 78억8000만원)에 불과하다고 설명했다. 미국이 첨단 반도체의 중국 수출을 규제하자 엔비디아가 H100의 하위버전으로 출시한 H800을 사용했다고 전했다.


이는 메타가 최신 AI 모델인 라마(Llama)3에 장착된 H100을 훈련시키기 위해 들인 비용의 10분의 1 수준인 것으로 알려졌다.

 

"미 규제가 되레 중국 AI 개발 촉진"


R1과 V3는 모두 오프소스로 공개됐다. 누구나 이 모델의 소스 코드를 열람하고 수정·배포할 수 있어 독점 모델인 오픈AI 모델과 대비된다.


또 딥시크는 쿼리(명령어)에 따라 문제 해결에 필요한 부분만 활성화하는 전문가 혼합(MoE) 기법을 활용해 효율성을 극적으로 높였다.


미국의 규제가 중국의 AI 개발을 촉진했다는 평가도 나온다.


파이낸셜 타임스(FT)는 “해외에서 들여오는 고성능 칩에 대한 의존도를 줄이기 위해 중국의 AI 기업들은 알고리즘, 아키텍처, 훈련 전략에서 새로운 접근 방식을 실험해왔다”고 밝혔다.


또 포브스는 “최신 하드웨어에만 의존할 수 없게 된 딥시크와 같은 기업들은 제한된 자원으로 더 많은 성과를 내기 위해 창의적인 해결책을 찾아야 했다”고 평가했다.


중국 매체들은 딥시크가 경력 1~2년 차 천재들이 모인 스타트업이라고 보도했다. 2023년 헤지펀드 하이 플라이어 퀀트에서 분사해 설립됐으며, 창립자 량원펑은 저장대에서 AI를 공부한 것으로 알려졌다.