OpenAI presenta una nueva herramienta de audio capaz de leer texto e imitar voces

Bloomberg — OpenAI comparte los primeros resultados de una prueba de una función que puede leer palabras en voz alta con una voz humana convincente, lo que destaca una nueva frontera para la inteligencia artificial y plantea el espectro de los riesgos de las falsificaciones profundas.

Opening Day Of The World Economic Forum (WEF) 2024Sam Altman, Photographer: Chris Ratcliffe/Bloomberg(Bloomberg/Chris Ratcliffe)

La compañía está compartiendo demostraciones iniciales y casos de uso de una vista previa a pequeña escala del modelo de texto a voz, llamado Voice Engine, que ha compartido con unos 10 desarrolladores hasta ahora, dijo un portavoz. OpenAI decidió no implementar más ampliamente la función, sobre la cual informó a los periodistas a principios de este mes.

Un portavoz de OpenAI dijo que la compañía decidió reducir el lanzamiento después de recibir comentarios de partes interesadas como formuladores de políticas, expertos de la industria, educadores y creativos. Inicialmente, la compañía había planeado lanzar la herramienta a hasta 100 desarrolladores a través de un proceso de solicitud, según la conferencia de prensa anterior.

“Reconocemos que generar un discurso que se parezca a las voces de las personas tiene serios riesgos, que son especialmente importantes en un año electoral”, escribió la compañía en una publicación de blog el viernes. “Estamos colaborando con socios estadounidenses e internacionales de todo el gobierno, los medios de comunicación, el entretenimiento, la educación, la sociedad civil y más para garantizar que incorporamos sus comentarios a medida que construimos”.

VER +

OpenAI y Salesforce acuerdan construir IA por el bien de la humanidad

Hugging Face, Scale AI y docenas de otras startups y empresas de tecnología también se mencionaron como firmantes en la carta

Ya se han utilizado otras tecnologías de inteligencia artificial para falsificar voces en algunos contextos. En enero, una llamada telefónica falsa pero que parecía realista, supuestamente del presidente Joe Biden, alentó a la gente de New Hampshire a no votar en las primarias, un evento que avivó los temores de AI antes de elecciones globales críticas.

A diferencia de los esfuerzos anteriores de OpenAI para generar contenido de audio, Voice Engine puede crear discursos que suenan como personas individuales, completos con su cadencia y entonación específicas. Todo lo que necesita el software son 15 segundos de audio grabado de una persona hablando para recrear su voz.

Durante una demostración de la herramienta, Bloomberg escuchó un clip del director ejecutivo de OpenAI, Sam Altman, explicando brevemente la tecnología con una voz que sonaba indistinguible de su discurso real, pero que fue completamente generada por IA.

“Si tienes la configuración de audio adecuada, es básicamente una voz de calibre humano”, dijo Jeff Harris, líder de producto de OpenAI. “Es una calidad técnica bastante impresionante”. Sin embargo, Harris dijo: “Obviamente hay mucha delicadeza de seguridad en torno a la capacidad de imitar con precisión el habla humana”.

VER +

Sam Altman, de OpenAI, regresa a la junta directiva después de ser absuelto en una investigación

La junta directiva de OpenAI también incorporará a Sue Desmond-Hellmann, a Nicole Seligman y a Fidji Simo

Uno de los socios desarrolladores actuales de OpenAI que utiliza la herramienta, el Instituto de Neurociencias Norman Prince del sistema de salud sin fines de lucro Lifespan, está utilizando tecnología para ayudar a los pacientes a recuperar la voz. Por ejemplo, la herramienta se utilizó para restaurar la voz de una paciente joven que perdió su capacidad de hablar con claridad debido a un tumor cerebral al replicar su discurso de una grabación anterior para un proyecto escolar, según la publicación del blog de la compañía.

El modelo de voz personalizado de OpenAI también puede traducir el audio que genera a diferentes idiomas. Eso lo hace útil para empresas del negocio del audio, como Spotify Technology SA. Spotify ya ha utilizado la tecnología en su propio programa piloto para traducir los podcasts de presentadores populares como Lex Fridman. OpenAI también promocionó otras aplicaciones beneficiosas de la tecnología, como la creación de una gama más amplia de voces para contenido educativo para niños.

En el programa de prueba, OpenAI requiere que sus socios acepten sus políticas de uso, obtengan el consentimiento del hablante original antes de usar su voz y revelen a los oyentes que las voces que escuchan son generadas por IA. La compañía también está instalando una marca de agua de audio inaudible para permitirle distinguir si una pieza de audio fue creada por su herramienta.

VER +

Conforme nos acerquemos a la IA habrá más riesgos, nerviosismo y estrés: Altman

Los rápidos avances en el campo y la carrera de las empresas por lograr un futuro hipotético de inteligencia artificial general han llevado a muchos legisladores a pedir que sea regulada

Antes de decidir si lanzar la función de manera más amplia, OpenAI dijo que está solicitando comentarios de expertos externos. “Es importante que la gente de todo el mundo comprenda hacia dónde se dirige esta tecnología, ya sea que finalmente la implementemos nosotros mismos o no”, dijo la compañía en la publicación del blog.

OpenAI también escribió que espera que la vista previa de su software “motive la necesidad de reforzar la resiliencia de la sociedad” frente a los desafíos que plantean las tecnologías de IA más avanzadas. Por ejemplo, la empresa pidió a los bancos que eliminen gradualmente la autenticación de voz como medida de seguridad para acceder a cuentas bancarias e información confidencial. También busca educación pública sobre el contenido engañoso de IA y un mayor desarrollo de técnicas para detectar si el contenido de audio es real o generado por IA.

Lea más en Bloomberg.com

OpenAI presenta una nueva herramienta de audio capaz de leer texto e imitar voces

Las noticias del día

IA

Inteligencia artificial

Tres países de América Latina figuran entre los destinos que más atraen millonarios en 2026

Así avanza el voto de colombianos en el exterior hoy 21 de junio

¿A qué hora se conocerá hoy 21 de junio el ganador de las elecciones de Colombia en segunda vuelta?

EE.UU. expresa a ASML su preocupación por la posible presencia de una máquina EUV en China

Los dos países que impulsarán la producción petrolera de América Latina hasta 2050, según OPEP

Copa Airlines y Avianca suspenden temporalmente sus vuelos a Caracas tras los terremotos

Chevron asegura que sus operaciones en Venezuela siguen activas tras los terremotos

Michelle Bolsonaro se distancia de la campaña de Flávio Bolsonaro por tensiones familiares

Los resultados de H&M decepcionan y ponen en duda la recuperación del crecimiento

Acciones asiáticas suben impulsadas por Micron y el renovado optimismo sobre la IA

Bolivia mantendrá el estado de excepción pese al fin de los bloqueos

Analistas detectan ventas de bonos y futuros del BCRA para frenar el dólar

La Fed de Kevin Warsh pone en jaque la apuesta por refugiarse en el oro y el bitcoin

Las tecnológicas frenan a Wall Street, mientras el petróleo y el oro profundizan su caída

El oro se acerca a los US$4.000 ante un dólar más fuerte y una Fed más restrictiva

¿La Bolsa de Caracas opera hoy? El mercado suspende actividades tras terremotos en Venezuela

Analistas difieren de qué viene para acciones de Ecopetrol: ¿subirá más o recogerán ganancias?

El boom de Polymarket y Kalshi apunta a US$1 billón, pero enfrenta bloqueos en América Latina

Grandes bancos de EE.UU. elevan dividendos tras superar pruebas de resistencia de la Fed

Anthropic acusa a Alibaba de acceso ilícito masivo a su modelo de IA Claude

Económicas e internacionales

Demandan a Tesla tras la muerte de una mujer al estrellarse un coche contra su casa

Irán y Omán coordinarán las evacuaciones a través del estrecho de Ormuz, según la OMI

El gasto en línea del Prime Day de Amazon supera las previsiones en su primer día

El oro se acerca a los US$4.000 ante un dólar más fuerte y una Fed más restrictiva

El petróleo cae mientras aumenta el tráfico en Ormuz y avanzan diálogos entre EE.UU. e Irán

El diésel en EE.UU. cae por debajo de US$5 por galón por primera vez desde marzo

Banco de Japón prevé más subidas de tasas ante el riesgo de una inflación superior al 2%

China debilita por cuarta sesión consecutiva la fijación del yuan frente al dólar

Lujos y vida en Bloomberg Línea

Los diamantes desplazan al oro como la joyería más deseada del lujo

Steam Machine: cuándo sale y cuánto costará la nueva PC de Valve que se ve como consola

Este es el artículo más barato para comprar en Saint Laurent

Bad Bunny, Selena Gomez y MrBeast destacan entre las mejores campañas con celebridades de 2026