엔씨소프트, '인터스피치 2022'서 3년연속 논문 발표

AI 합성음 품질 향상 연구…업계 최고 수준 성능 갖춘 음성합성 시스템 구현
황성완 기자 2022-09-15 14:54:16
판교 엔씨소프트 사옥 /사진=엔씨소프트
판교 엔씨소프트 사옥 /사진=엔씨소프트
[스마트에프엔=황성완 기자] 엔씨소프트는 국제 인공지능(AI) 학회 '인터스피치 2022(INTERSPEECH 2022)'에서 3편의 논문을 발표한다고 15일 밝혔다.

올해 23회차를 맞는 인터스피치는 글로벌 AI 기업들이 최신 기술을 공유하는 세계 최고 권위의 음성 AI 학회로, 인터스피치 2022는 인천 송도 컨벤시아에서 오는 18일부터 22일까지 진행된다.

엔씨소프트 AI 센터 산하 '스피치 AI 랩(Speech AI Lab)'은 오랜 기간 음성합성 관련 연구를 진행하며 권위 있는 학회에 결과를 공유해왔다. 인터스피치에도 3년 연속 논문을 게재했고, 올해는 3편의 논문이 채택됐다. 논문 3편의 주제는 △적대적 다중 작업 학습을 기반으로 음색과 피치 표현을 분리 모델링 하는 방안 연구 △사전 학습된 뉴럴 보코더를 이용한 발화 품질 향상 연구 △합성음의 표현력을 다양화해 자연스러움을 향상시키기 위한 연구 등이다.

엔씨소프트는 이번 연구를 통해 음성합성(TTS)과 가창합성(SVS) 시스템의 품질과 자연스러움을 업계 최고 수준까지 구현했다고 주장했다.

김희만 엔씨소프트 스피치 AI 랩 실장은 "엔씨소프트의 음성 AI 기술은 이미 상용화를 넘어 다음 단계를 바라보고 있다"며 "차별화된 수준의 기술을 연구하고 그 결과를 외부와 꾸준히 공유할 생각"이라고 말했다.

한편, 엔씨소프트는 인터스피치 학회에 부스를 마련해 연구 현황을 공유하고 데모 버전을 시연한다. 학회 참여자는 부스에서 엔씨(NC)의 음성 AI 기술 수준을 확인하고 AI 인력 채용에 대한 상담도 진행할 수 있다.



황성완 기자 skwsb@smartfn.co.kr

댓글

(0)
※ 댓글 작성시 상대방에 대한 배려와 책임을 담아 깨끗한 댓글 환경에 동참에 주세요. 0 / 300