• 맑음동두천 -0.4℃
  • 구름많음강릉 11.5℃
  • 흐림서울 2.9℃
  • 맑음대전 -0.3℃
  • 맑음대구 -0.1℃
  • 맑음울산 3.2℃
  • 맑음광주 2.5℃
  • 맑음부산 8.3℃
  • 흐림고창 -0.4℃
  • 구름많음제주 9.1℃
  • 흐림강화 2.5℃
  • 맑음보은 -4.2℃
  • 맑음금산 -3.7℃
  • 구름많음강진군 -0.4℃
  • 구름조금경주시 -1.9℃
  • 맑음거제 3.3℃
기상청 제공

LIFE platform

[해봤습니다] 회의록 쓸 시간 없어 마음 급하다면, 네이버 ‘클로바노트’

긴 문장을 인식하는데 특화된 네스트(NEST) 엔진과
참석자 목소리 차이 구분해주는 와이즈(WISE)엔진 적용
"'자주 쓰는 단어'에 업계 전문용어나 고유명사 등록해두면
해당 단어 염두에 두고 인식 해서 정확도를 높일 수 있다"

URL복사

[편집자주] 매일 쏟아져 나오는 새로운 IT 서비스‧디바이스를 체험해보기는 어렵습니다. 이에 <투데이e코노믹> 기자가 독자 대신 직접 사용해 관련 정보를 제공해드립니다. 

 

[투데이e코노믹 = 이지혜 기자] 사내에서 회의록을 작성하는 일, 중요한 거래처와의 통화를 녹음해 받아적는 일, 교수님의 강의를 받아적는 일을 ‘네이버 클로바 노트’가 대신 해준다고 한다. 진짜일까.

 

네이버는 29일 AI 기술이 적용된 음성기록 서비스 ‘클로바노트’를 출시했다. 클로바노트는 녹음 음성을 텍스트로 변환해주는 서비스로, 클로바노트 앱에서 직접 녹음하거나 앱 또는 PC에서 음성 파일을 업로드하면 해당 내용이 텍스트로 변환된다.

 

뿐만 아니라 화자도 구분해준다. 변환된 녹음 내용 중 다시 듣고 싶은 부분의 텍스트를 클릭하면 해당 내용을 바로 들을 수도 있다. 잘못 변환된 부분이 있다면 수정 가능하다.

 

클로바노트의 서비스에는 클로바의 AI 음성인식 기술 중 긴 문장을 인식하는데 특화된 네스트(NEST, Neural End-to-end Speech Transcriber) 엔진과 참석자의 목소리 차이를 구분해주는 와이즈(WISE, Who Is Speaking)엔진이 적용됐다.

 

네스트는 정형화되지 않은 장문의 음성을 AI가 자동으로 인식해 텍스트로 변환해주는 기능이다. 지난 4월 일반인에게 공개된 이 기능은 다량의 정제된 데이터를 사전에 학습하지 않고도 예상치 못한 표현에 대해 정확한 음성 인식이 가능한 것이 장점이다.

 

대학생, 직장인, 그리고 기자에게도 반가운 서비스가 아닐 수 없다. 그렇다면 그 정확도는 어떤지 직접 체험해봤다.

 

 

훌륭한 퀄리티! 하지만 영어는...

 

3분 가량의 통화녹음 파일(.m4a)을 변환하는데는 10초 가량이 걸렸다. 중간에 고유명사들이 잘못 쓰여진 부분이나 문법이 틀린 부분이 있긴 했지만, 이 정도로 짧은 시간에 변환된 결과라고 본다면 훌륭했다.

 

하지만 표준어가 아니라 사투리를 쓰는 화자라면 어떨까. 궁금증을 해결하기 위해 특유의 경상도 사투리로 유명한 허구연 프로야구 해설위원의 목소리를 녹음(.mp3)해서 변환했다.

 

지난 9월 허 해설위원의 유튜브에 업로드된 영상으로, 세인트루이스 카디널스 소속 김광현 투수의 피칭에 관한 내용이다. 라이브 방송인 탓에 음질이 깔끔하지 않고, 전문 용어가 자주 나온다는 점에서 ‘사투리를 많이 사용하는 대학 교수의 강의 녹음본’과 비교해볼 수 있을 것 같다.

 

변환 결과를 평가하자면 역시 ‘생각보다 괜찮다’고 할 수 있다. 허 해설위원의 사투리가 표준어로 상당 부분 잘 변환되어 나타났다. 일부 명사에 오류가 있었다는 점(사이언 상→시민왕, 피칭→비준, 더블플레이→더블페이 등)을 제외하면 특별한 문제가 없었다.

 

이렇게 오류가 있는 부분을 클릭하면 그 내용에 해당하는 녹음이 바로 흘러나오기 때문에, 잘못된 부분은 수정이 가능하다. 필요한 부분만을 찾아들으면서 일일이 녹음을 다 들어봐야 하는 수고도 덜 수 있다. 참석자를 구분해주는 기능 역시 유용하다.

 

다만 실시간으로 받아적는 기능은 없기 때문에 당장 녹음본이 필요한 상황보다는 수업을 다시 듣거나 회의록을 작성할 때 사용해야 한다.

 

클로바는 영어도 받아적을 수 있을까. 아쉽게도 영어 강의를 들을 때는 사용할 수 없다. 스티브 잡스의 2005년 스탠포드 대학교 졸업식 연설을 녹음해 클로바노트에게 들려줬지만, 영어가 아닌 한글로 인식하면서 무의미한 문장을 늘어놓는 등 기대와는 다른 결과가 나왔다.

 

AI가 적용된 클로바노트는 사용할수록 정확도가 높아지고, 자주 쓰는 용어를 등록해둔다면 더 좋은 결과를 얻을 수 있도록 되어 있다.

 

시험 기간 수업을 다 정리하지 못해 마음이 급한 자녀에게, 밀린 업무가 많아 회의록 작성에 많은 시간을 투자할 수 없는 직장 동료에게 클로바노트를 소개해준다면, 말 그대로 ‘구원자’가 될 수 있을 것으로 보인다.

 

손서희 네이버 홍보 담당자는 이날 본지에 “네이버에 한국어 데이터가 제일 많기 때문에 현재는 한국어에 특화된 서비스에 맞춰 개발하고 있다”고 설명했다.

 

이어 “클로바노트는 음성을 인식할 때 일반적으로 많이 쓰이는 단어로 간주하기 때문에 업계 전문 용어 같은 경우에는 일부 부정확할 수 있다. 이때는 ‘자주 쓰는 단어’에 업계 전문용어나 고유명사 등을 미리 등록해두면 해당 단어를 염두에 두고 인식을 해서 정확도를 높일 수 있다. 최대 500개까지 등록 가능하다”고 ‘팁’을 건넸다.