전략_경영/AI트랜스포메이션
오픈AI 사람의 목소리를 재현하는 생성AI '보이스엔진(Voice Engine)' 개발
Marketcast
2024. 3. 30. 22:33
오픈AI가 개발한 최신 생성 AI 'Voice Engine'은 사용자의 목소리를 놀랍도록 정확하게 재현할 수 있다. 단 15초의 목소리 샘플과 텍스트 입력만으로, 해당 화자의 목소리로 음성을 합성할 수 있으며, 다양한 외국어로의 변환도 지원한다.
이 기술은 2022년 후반부터 개발되어 왔으며, 이미 채팅 GPT에 음성 입출력 기능을 통합하는 등, 합성 음성 기술의 발전을 통해 실제 인간의 목소리를 더욱 리얼하게 재현하는 데 성공했다.
Voice Engine은 아동에게 독서를 들려주기, 기업 제품 소개, 의료 상담, 언어 장애 지원 등 다양한 분야에 활용가능하다. 또한, 사용자의 목소리 톤과 감정까지 재현하며 다언어 지원도 가능하여 폭넓은 적용 범위를 가지고 있다.
음성 엔진은 교육, 의료, 비즈니스 등 다양한 분야에서 폭넓은 가능성을 열어가고 있으며, 이를 통해 사람들의 삶의 질을 향상시키고 있다.
그러나, 합성 음성 기술이 범죄에 악용될 수 있다는 우려도 있다. 예를 들어, 미국에서는 조 바이든 대통령의 목소리를 모방한 가짜 전화가 선거에 사용된 사례가 있다. 이에 대응하여, 오픈AI는 기술의 일반 공개를 유보하고, 시험 운용과 함께 철저한 검증 과정을 진행할 예정이다.
오픈AI는 "사람의 목소리를 모방하는 기술은 큰 위험을 수반할 수 있으며, 특히 선거 기간에는 더욱 신중해야 한다"고 언급하며, 정부 및 외부 기업과의 협력을 통해 안전 대책과 사용 상황 모니터링에 적극적으로 나서고 있음을 밝혔다.