초고화질 음성 분석·스타일 변환 게임·미디어 오디오 제작 혁신

NC AI가 세계 최대 음성·언어 기술 학회인 ‘인터스피치(INTERSPEECH) 2025’에서 몬스터 사운드 생성·변환 AI 기술을 전 세계에 공개한다고 18일 밝혔다.

인터스피치는 국제 음성커뮤니케이션협회(ISCA)가 주최하는 세계 최대 규모의 음성 및 언어 기술 학회로, 매년 전 세계 음성 연구자와 산업 관계자가 모여 최신 연구 결과와 혁신 기술을 공유하는 자리다. 17일(현지시간)부터 21일까지 네덜란드 로테르담에서 개최되는 이번 26회 학회는 ‘공정하고 포용적인 음성 과학과 기술’을 주제로 진행된다.

NC AI는 이번 학회에서 몬스터 사운드에 특화된 고품질 음색 변환 모델의 구조와 학습 기법을 상세히 다룬 논문과, 이를 웹 기반 실시간 변환 시스템으로 구현한 데모 구축 사례 논문 등 총 2편을 발표한다.

현장에서는 방문자가 마이크를 통해 말하거나 사운드를 업로드하면 즉각 특정 몬스터의 울음이나 포효 같은 음색으로 변환되는 체험형 데모가 제공된다. 온라인 데모 페이지도 공개해 현장에 오지 못한 이들도 이 첨단 기술을 체험할 수 있다.

NC AI는 이번에 선보이는 기술을 대규모 다중접속역할수행게임(MMORPG) 게임에서 몬스터 사운드 제작 방식을 혁신적으로 바꾸는 도약할 것이라고 평가했다. CD 수준(44.1kHz)으로 음성을 분석, 캐릭터 고유의 거친 숨소리나 날카로운 포효까지 놓치지 않고 담아낸 뒤, 원래 음성의 내용은 유지하면서도 원하는 스타일만 정확하게 덧입힌다.

권제인 기자