Mark Zuckerberg, el CEO de Meta, anunció a través de su canal de difusión en Instagram que muy pronto incorporará en las redes sociales que forman parte de la compañía un traductor que funcionará con inteligencia artificial.
‘SeamlessM4T’, como fue llamado el modelo de IA, está diseñado para traducir y transcribir texto y audio en cerca de 100 idiomas.
Según Meta, esta tecnología representa un avance significativo en conversaciones de voz a voz y de voz a texto, ya que puede traducir simultáneamente varios idiomas que estén involucrados en la charla.
"‘SeamlessM4T’ reconoce implícitamente los idiomas de origen sin necesidad de un modelo de identificación de idiomas separado", señaló la compañía.
Publicidad
El nuevo traductor está basado en ‘Massively Multilingual Speech’, el marco de Meta que proporciona reconocimiento de voz, identificación de idiomas y tecnología de síntesis de voz; además, es una especie de sucesor de ‘No Language Left Behind’ de Meta, el cual traduce automáticamente un texto, pero no está configurado para conversaciones de voz.
‘SeamlessM4T’ es capaz de identificar palabras ofensivas que incitan al odio, el abuso y la violencia, y las bloquea al momento de traducir el mensaje que se quiere transmitir, ya sea a través de texto o verbalmente.
Publicidad
“Filtramos la toxicidad desequilibrada en los datos de entrenamiento. Si la entrada o la salida contenían cantidades diferentes de toxicidad, eliminamos esa secuencia de aprendizaje”, afirmó Meta.
Meta lanzó una IA con la que se puede crear música a partir de un texto
Meta anunció recientemente el lanzamiento de una inteligencia artificial con la capacidad de crear música y efectos de sonido a partir de texto. Esta innovadora herramienta consta de tres modelos generativos, conocidos como MusicGen, AudioGen y EnCodec, que abarcan diversas áreas en la generación de sonidos.
A través de su blog oficial, la compañía informó que Audiocraft, como se denomina esta nueva IA, está diseñada para permitir a las personas crear música y efectos de sonido de manera gratuita.
MusicGen, que debutó con música propiedad de Meta y bajo una licencia específica, tiene la habilidad de generar composiciones musicales a partir de texto. Por otro lado, AudioGen se encarga de producir sonidos ambientales y efectos de sonido a partir de palabras escritas.
Publicidad
Según la empresa, estos modelos están disponibles de manera gratuita con el objetivo de fomentar la investigación y mejorar la comprensión de la inteligencia artificial por parte de los usuarios.
"La familia de modelos AudioCraft es capaz de producir audio de alta calidad con consistencia a largo plazo y se puede interactuar fácilmente a través de una interfaz natural. Con AudioCraft, simplificamos el diseño general de modelos generativos para audio en comparación con el trabajo previo en este campo, proporcionando a las personas las herramientas completas para experimentar con los modelos existentes que Meta ha desarrollado durante los últimos años, empoderándolos para sobrepasar límites y desarrollar sus propios modelos", se destaca en el blog.
Publicidad
Gracias a esta inteligencia artificial, es posible crear clips de audio de 15 segundos basados en texto descriptivo o algunas palabras en inglés. Estos clips pueden reproducirse en formato MP4 y descargarse en el ordenador, si se desea.
"Creemos que MusicGen puede convertirse en un nuevo tipo de instrumento, similar a cómo surgieron los sintetizadores en su momento", concluye Meta.
Le puede interesar "El Sistema de Alerta de Terremotos de Google que podría salvarle la vida":