해외소식 해외의 최신 소식을 전합니다.
해외소식2024-04-01 13:28:08
0 1 0
“15초 듣고 순식간에 음성 모방”…오픈AI, 신기술 공개
내용

입력2024.03.30. 오전 11:30

 

원본보기

지난달 26일 촬영된 오픈AI와 챗GPT 로고. AFP연합뉴스

오픈AI가 사람의 음성을 학습해 모방 음성을 생성하는 인공지능(AI) 도구 ‘보이스 엔진(Voice Engine)’을 공개했다. 다만 인조 음성 기능의 오용 가능성을 고려해 본격적인 출시 여부에 대해서는 신중히 접근하겠다는 입장이다.

오픈AI는 29일(현지시간) 자사 블로그에 ‘인조(Synthetic) 음성의 도전과 기회 탐색하기’라는 제목의 글을 올려 “15초 분량의 음성 샘플만 있으면 보이스 엔진을 이용해 원래 화자의 목소리와 비슷한 음성을 만들어 낼 수 있다”고 밝혔다.

오픈AI는 2022년 말 보이스 엔진을 처음 개발했으며 이를 챗GPT의 음성인식·읽어주기 기능과 텍스트-음성 변환 API(응용프로그램 인터페이스)에서 쓰이는 음성 기능 강화에 사용했다고 설명했다. 이어 이 기술의 잠재적인 활용 가능성을 알아보기 위해 지난해 말부터 신뢰할 만한 소규모 그룹과 함께 비공개 테스트를 시작했다고 부연했다.

 

이날 오픈AI가 공개한 실제 사람의 음성 샘플과 보이스 엔진으로 생성한 음성은 구분이 어려울 정도로 비슷했다. 원본 샘플과 같은 목소리로 다른 외국어도 구현할 수 있었다.

오픈AI는 “이 도구를 어린이 교육을 위한 음성 해설 콘텐츠나 실시간 개인 맞춤형 응답 생성 기능 등 다양한 분야에서 활용할 수 있다”며 “또 언어 기능에 영향을 주는 질환을 앓는 환자들을 위한 치료 애플리케이션이나 장애인을 위한 소통 기기에 지원된 사례도 있다”고 소개했다.

다만 “인조 음성 기능의 오용 가능성 때문에 더 광범위한 출시에 대해서는 조심스럽게 접근하고 있다”며 “현재로서는 이 기술을 미리 공개하되 널리 출시하지는 않기로 했다”고 전했다. 사람의 목소리를 닮은 음성을 생성하는 것은 심각한 위험을 야기하며, 선거가 있는 해에는 특히 더 그렇다는 것을 인지하고 있다는 게 회사 측 설명이다.

오픈AI는 “현재 보이스 엔진을 테스트 중인 파트너들은 당사자의 동의나 법적 권리 없이 개인이나 단체를 사칭하는 것을 금지하는 사용 정책에 동의했다”며 “보이스 엔진에서 생성된 모든 음성의 출처를 추적하기 위한 워터마킹 등 일련의 안전 조치를 구현했다”고 전했다.

블룸버그통신은 “오픈AI가 사람의 목소리를 흉내 낼 수 있는 기능을 공개하며 AI 기술의 새로운 지평을 열었다”면서도 “이는 딥페이크(딥러닝과 AI로 만든 영상, 이미지 등의 가짜 콘텐츠) 위험에 대한 불안감도 일으키고 있다”고 지적했다.

지난 1월 미국에서는 뉴햄프셔주 프라이머리(예비경선)를 하루 앞두고 조 바이든 미국 대통령을 사칭한 가짜 전화가 주민들에게 걸려 와 투표 거부를 독려하는 사건이 벌어진 바 있다.

장은현 기자(eh@kmib.co.kr)

스크랩 0