Verdadero o Falso

Con esta herramienta podrás detectar si ese audio es un 'fake' o no

En la Universidad de Granada desarrollan una aplicación entrenada para averiguar si la voz que escuchas está generada artificialmente con un programa de IA
Catbot, el simulador para probar la detección de voces falsas comparándolas con las reales. / Universidad de Granada

Como en muchos casos, las diversas tecnologías no son malas o buenas en sí. Es el uso que se haga de ellas lo que es negativo o positivo. Es lo que sucede con la inteligencia artificial.

Los avances en el uso de redes neuronales profundas, una de las bases de las IA, para la síntesis de audio están permitiendo obtener voces sintéticas cada vez más realistas. Esto tiene grandes ventajas, pues permite dotar de voces más inteligibles a los sistemas automáticos (lectores de texto, asistentes virtuales, robots…), así como controlar sus características, haciéndolas más expresivas y diversas.

Sin embargo, la síntesis de habla también se puede utilizar para crear o manipular grabaciones de audio con fines maliciosos,omo la suplantación de identidad en estafas telefónicas o la generación de noticias falsas.

Detectar audios ‘fake’

Ante la cada vez mayor perfección y entrenamiento de la IA en la creación de audios falsos y la dificultad para detectarlos, son muchos los esfuerzos que se dirigen a elaborar herramientas que los identifiquen.

Hasta ahora, el audio ha sido un problema menor en las redacciones de los medio de comunicación en comparación con otros tipos de fake, como las fotografías o los vídeos, pero en los últimos dos años está ganando terreno, por lo que es preciso contar con herramientas que ayuden a la detección de audios falsos y puedan servir como fuente de verificación.

Así, investigadores de la Universidad de Granada (UGR), pertenecientes al departamento de Lenguajes y Sistemas Informáticos, han diseñado un sistema pionero en el mundo que permite discernir si un audio de voz es real o está generado mediante algoritmos de IA.

Este trabajo, realizado en el marco de la Cátedra RTVE-UGR, han participado los investigadores de la UGR Zoraida Callejas, David Griol y Daniel Calderón, expertos en sistemas conversacionales y tecnologías del habla y del procesamiento. También ha participado la empresa Monoceros Labs.

Cómo lo hacen

Las líneas de investigación mencionadas se han aplicado en este caso a la verificación de audios para combatir la desinformación. “Hemos generado una herramienta que integra soluciones propias y de terceros para discernir si un audio es real o está generado con algoritmos de inteligencia artificial –han explicado los investigadores de la UGR–. Una de las novedades que introduce esta herramienta es que no sólo integra modelos generales, sino también modelos específicos generados en la UGR para voces de personalidades que son objetivo frecuente de desinformación”.

Los científicos han puesto como ejemplo voces clonadas mediante técnicas de IA para la conversión y clonación de voz de Monoceros pertenecientes al rey Felipe VI, al presidente del Gobierno, Pedro Sánchez, o la vicepresidenta Yolanda Díaz. “Nuestro objetivo no es generar estas voces sintéticas de manera artificial, sino entrenar a nuestra IA mediante estas voces generadas por nosotros para que así el sistema pueda identificar si una voz es falsa o no con una alta precisión”, han destacado los investigadores de la UGR.

Actualmente se está trabajando para ir más allá de la verificación y desarrollar herramientas para los periodistas basadas en IA conversacional, que proporcionen interactividad, accesibilidad y personalización de contenidos informativos.

Simulación de los nodos en capas de una red neuronal. Kittipong Jirasukhanon/Freepik

¿Qué es una red neuronal?

Una red neuronal es un método de la inteligencia artificial (IA) que enseña a las computadoras a procesar datos de una manera similar a como lo hace el cerebro humano. Es un proceso llamado aprendizaje profundo, el cual utiliza los nodos, o neuronas artificiales, interconectados en una estructura de capas que se parece al cerebro humano. Crea un sistema adaptable que los ordenadores utilizan para aprender de sus errores y mejorar. Las redes neuronales ayudan a los ordenadores a tomar decisiones inteligentes. Esto se debe a que pueden aprender y modelar las relaciones entre los datos de entrada y salida que no son lineales y que son complejos.

Las células del cerebro humano, las neuronas, forman una red compleja muy interconectada y se envían señales eléctricas entre sí para ayudar procesar la información. Una red neuronal artificial, que es un programa o un algoritmo, está formada por nodos que trabajan juntos para resolver un problema.

De esta forma, una red neuronal simple tiene nodos interconectados en tres niveles o capas básicas. Una de entrada por la que llega la información y los datos. Sus nodos los procesan, los analizan o los clasifican y los pasan a la siguiente capa, la oculta.

Las capas ocultas, que puede ser solo una o varias sucesivas, analizan la salida de la capa anterior, la procesan aún más y la pasa a la siguiente capa.

Al final de todas ellas está la capa de salida, que es la que proporciona el resultado final de todo el procesamiento de datos que realiza la red.

08/12/2024