SeamlessM4T: un modelo de IA capaz de transcribir y traducir cerca de 100 idiomas

SeamlessM4T

SeamlessM4T, el primer modelo de traducción de IA multimodal y multilingüe todo en uno que permite a las personas comunicarse sin esfuerzo a través del habla y el texto en diferentes idiomas.

En su afán por desarrollar una inteligencia artificial capaz de comprender una amplia gama de dialectos, Meta ha creado un modelo de IA, SeamlessM4T, capaz de traducir y transcribir cerca de 100 idiomas en texto y voz.

Disponible en código abierto junto con SeamlessAlign, un nuevo conjunto de datos de traducción, Meta afirma que SeamlessM4T representa un «avance significativo» en el campo de la conversión de voz y texto en IA.

«Nuestro modelo único proporciona traducciones a la carta que permiten a las personas que hablan diferentes idiomas comunicarse de manera más eficaz», escribe Meta en una entrada de blog compartida con TechCrunch. «SeamlessM4T reconoce implícitamente los idiomas de origen sin necesidad de un modelo separado de identificación de idiomas».

SeamlessM4T es una especie de sucesor espiritual de Meta’s No Language Left Behind, un modelo de traducción automática de texto a texto, y de Universal Speech Translator, uno de los pocos sistemas de traducción directa de voz a voz compatible con el idioma hokkien. Y se basa en Massively Multilingual Speech, el marco de Meta que ofrece reconocimiento del habla, identificación de idiomas y tecnología de síntesis del habla en más de 1.100 idiomas.

  • Reconocimiento de voz en casi 100 idiomas
  • Traducción de voz a texto para casi 100 idiomas de entrada y salida
  • Traducción de voz a voz, compatible con casi 100 idiomas de entrada y 36 (incluido el inglés) de salida
  • Traducción de texto a texto en casi 100 idiomas
  • Traducción de texto a voz, compatible con casi 100 idiomas de entrada y 35 (incluido el inglés) de salida