El avance de la inteligencia artificial (IA) ha sido notable, particularmente en el campo de la generación de voz. Desde los primeros asistentes virtuales hasta los sistemas que la IA ha logrado replicar aspectos del comportamiento humano de manera sorprendente. Ahora un reciente desarrollo de la empresa Sesame ha llevado a desarrollar un nivel completamente nuevo entre el humano y la máquina.
Sesame permite que los avatares virtuales se conviertan en nuestros amigos y ese servicio se logra con un modelo de IA que genera texto, como ChatGPT. Hasta ahora chateábamos con las máquinas, pero poco a poco estamos comenzando a hablar con ellas. Maya y Miles de Sesame han impresionado, ya que el sistema de IA no solo genera voz, sino que logra imitar de manera muy natural lo que se siente al interactuar con una persona real.
Maya y Miles
Algunos usuarios han informado que han sentido una conexión emocional con las voces femenina y masculina del modelo: Maya y Miles. Un usuario publicaba sus impresionas: “Estoy hasta un poco preocupado por si comienzo a sentirme emocionalmente ligado a un asistente de voz con este nivel de sonido humano”.
Cualquiera puede probar hablar con Maya o Miles, en el sitio web Sesame. El único obstáculo es que las conversaciones deben ser en inglés, ya que por el momento no habla otros idiomas. Estos asistentes son cálidos y cercanos, pero sobre todo imitan a la perfección la forma en la que hablaría una persona. La generación de voz es instantánea y da la sensación de estar manteniendo una conversación con otro ser humano.
La naturalidad de voz de Sesame
Lo que se puede notar de Miles es que funcionan de una manera muy distinta a todos los demás modelos, ya que no solamente hablan y ofrecen información, sino que se centran en mantener una charla natural, fluida y profunda con el usuario. Esta función se da gracias a la gran cantidad de ecuaciones matemáticas y códigos que le permiten con naturalidad expresar la risa, la respiración, los cambios de tonalidad, las señales expresivas.
Es capaz de detectar la personalidad o el estado de ánimo de la persona cuando lleva unos minutos hablando con esta tecnología. Además, puede darse cuenta de los silencios y te pregunta si sigues allí o incluso la máquina puede sorprenderte con temas de conversación, con la finalidad de saber más sobre ti, mientras realiza expresiones similares a las humanas.
Estos asistentes de voz se pueden usar de manera gratuita, aunque se encuentre disponible en inglés. Por ejemplo, si le pides que hable español, lo intentará, pero tendrá un acento raro porque le cuesta hablar este idioma. Sin embargo, es un buen momento para aprender inglés y saber cómo funciona.