El 29 de marzo, OpenAI presentó el software Voice Engine, que utiliza inteligencia artificial para crear voces basadas en grabaciones cortas de solo 15 segundos y es capaz de leer texto. También puede reproducir voz en idiomas extranjeros, incluso con grabaciones que utilizan sólo inglés.
Voice Engine ha sido desarrollado por OpenAI desde 2022 y se probó con un grupo de clientes a finales de 2023. En él, el software ha demostrado la capacidad de facilitar la lectura, traducir contenido entre diferentes idiomas y crear voces para personas que han perdido la capacidad de hablar.

Sin embargo, OpenAI también enfatizó los riesgos potenciales de la tecnología de imitación de voz, especialmente en el contexto de las elecciones presidenciales de Estados Unidos. Esta es parte de la razón por la que decidieron limitar el acceso y no hacer que esta tecnología esté ampliamente disponible.
Según la empresa propietaria de ChatGPT, el anuncio de Voice Engine tiene como objetivo incentivar a los directivos y al público a aumentar su vigilancia contra las estafas que utilizan inteligencia artificial. Los desarrolladores también advierten que los delincuentes podrían usar software de suplantación de voz para robar información personal o piratear los sistemas de seguridad de los bancos.
“Es importante que la gente entienda hacia dónde se dirige esta tecnología, independientemente de si la lanzamos ampliamente o no”, afirmó OpenAI.

La tecnología de edición de voz que utiliza inteligencia artificial ganó atención después de que una grabación que imitaba la voz del presidente estadounidense Joe Biden instando a la gente a "no participar en las primarias demócratas de New Hampshire" se volviera viral en las redes sociales en enero.
Pindrop Security, empresa especializada en detectar fraudes de voz, analizó luego la grabación y concluyó que se trataba de un deepfake utilizando tecnología de ElevenLabs, una startup que desarrolla software de inteligencia artificial que genera voces en más de 20 idiomas.
Según la revista Fortune, la voz deepfake del Sr. Biden ha generado preocupación entre muchos expertos y funcionarios electorales estadounidenses, calificándola de "un intento de interferir en las elecciones impulsadas por inteligencia artificial". Algunas evaluaciones muestran que no solo es fácil distribuir deepfakes de audio, sino que también existe el riesgo de que actores maliciosos usen esta tecnología para influir en los resultados electorales y disuadir a los votantes de acudir a las urnas.