[도쿄(일본)=안희정]라인플러스가 개발한 실시간 커뮤니케이션 솔루션 '라인 플래닛'이 음성으로 AI와 대화하는 시대를 연다. 회사는 라인 플래닛에 AI를 적용해 '보이스 AI'라는 서비스를 선보이며, 고객상담이나 교육, 엔터테인먼트뿐만 아니라 회의에서도 음성 AI 적용 범위가 계속 확대될 것으로 내다봤다.
1일 일본 도쿄에서 LY(라인야후)코퍼레이션이 연 기술 컨퍼런스 테크버스2025에서 정덕범 라인플러스 프로덕트 매니저는 이날 발표에서 “보이스 AI는 텍스트 중심의 AI 커뮤니케이션을 넘어서는 다음 단계”라며 "AI 음성 에이전트를 구성하는 기술 구조와 활용 가능성에 대해 설명했다.
먼저 정 매니저는 라인의 통화 기술을 외부에서도 사용할 수 있도록 만든 제품이 ‘라인 플래닛’이라고 소개했다.
정 매니저는 “2억 명이 사용하는 라인의 통화 품질 그대로 가져온 솔루션”이라며 “iOS, 안드로이드, 윈도우, 맥OS, 웹, 플러터 등 대부분의 플랫폼에서 쓸 수 있고, 품질 면에서도 자신 있다”고 강조했다. 그는 “라인의 다양한 노하우가 담겨 있어 스케일러빌리티 측면에서도 강점이 있다”고 말했다.
정덕범 라인플러스 프로덕트 매니저(사진=지디넷코리아)
보이스 AI 확장성 무궁무진
정 매니저는 보이스 AI가 왜 지금 중요한지를 설명하며 “사람들은 SF 영화나 드라마 속 AI와 대화할 때 문자보다 목소리를 사용한다”며 “자연스럽게 대화하는 방식의 흐름이 지금의 AI 발전과 함께 보이스 중심으로 전환되고 있다”고 말했다. 그는 “지금이야말로 AI와 음성으로 대화하는 시대로 넘어가는 초입”이라고 정의했다.
구체적인 사례도 제시했다. 한 미국 보험사는 야간 상담에 AI 에이전트를 도입한 뒤 사용자 반응이 좋아 24시간 대응으로 확장했고, 이스라엘에서는 AI 튜터를 활용한 1만 명 대상의 교육 파일럿이 진행 중이다. 또 아인슈타인과 대화할 수 있는 서비스나, 게임 속 NPC가 AI로 동작하는 실험도 소개하며 보이스 AI의 확장성을 강조했다.
정 매니저는 “AI와 사람처럼 자연스럽게 대화하려면 단순히 STT(음성→텍스트)나 TTS(텍스트→음성)만으로는 부족하다”고 말하며 대화 품질을 위한 전처리 기술과 네트워크 안정화, 발화 제어 기술 등을 하나씩 설명했다. 그는 “사용자의 목소리에 집중하게 해주는 ‘노이즈 서프레션’, 스피커에서 다시 입력되는 에코를 제거하는 ‘어쿠스틱 에코 캔슬레이션’이 꼭 필요하다”고 말했다.
그는 “AI가 사람이 말한 걸 인식할 때, 대화의 흐름을 이해하고 끼어들거나 멈추는 시점을 잘 구분하는 게 중요하다”며 “보이스 액티비티 디텍션(VAD)과 턴 디텍션은 AI 대화에서 필수 기술”이라고 강조했다.
라인 플래닛
“AI가 잘 들으면, 더 나은 답을 한다”
정 매니저는 라인의 전처리 기술이 보이스 AI에 얼마나 영향을 미치는지를 실험으로 입증했다. 그는 “SNR(신호 대비 잡음비)을 기준으로, 노이즈 환경에서 전처리 없이 보낸 음성은 거의 인식이 되지 않았고, 전처리를 적용하자 인식률이 눈에 띄게 향상됐다”고 설명했다.
실제 STT 결과뿐 아니라, 오픈AI의 리얼타임 API를 활용한 실시간 음성 인식 실험에서도 같은 결과가 나왔다. 정 매니저는 “전처리 없이 보낸 음성은 1dB 환경에서도 AI가 인식에 실패했고, 전처리를 하면 100% 정확히 인식했다”며 “좋은 품질의 음성을 제공하면 AI가 더 나은 답을 줄 수 있다”고 강조했다.
그는 AI의 말이 다시 입력되는 문제, 즉 에코 현상에 대해서도 지적하며 “1:1 통화에서는 용인될 수 있지만, 그룹콜에서는 AI가 자신이 한 말을 다시 듣게 돼 문제를 일으킬 수 있다. 이 때문에 에코 캔슬레이션은 더욱 중요해진다”고 역설했다.

관련기사
- 민주당, 김홍일 방통위원장 탄핵 추진..."6월내 통과 목표"2024.06.27
- 김홍일 위원장 "2인 체제 방통위, 바람직하지 않지만 위법 아니다”2024.06.21
- LG 구광모 6년...AI·바이오·클린테크 키운다2024.06.28
- 화재 막는 배터리 진단기술 뜬다...민테크, 상장 후 존재감 '쑥쑥'2024.06.28