Meta dévoile SeamlessM4T, un nouveau modèle de traduction
Échanger avec le peuple H’Mông au Vietnam. © iStock.
Dans le cadre de ses efforts visant à créer un traducteur universel, Meta a publié un nouveau modèle de traduction appelé SeamlessM4T (M4T pour Massively Multilingual and Multimodal Machine Translation, c’est-à-dire traduction automatique massivement multilingue et multimodale). Le modèle est capable de traiter près de 100 langues en entrée/sortie (100 en sortie pour la traduction vers l’écrit, mais seulement 35 langues en sortie dans le cas de la traduction vers la parole de synthèse). Il est publié sous licence Creative Commons CC BY-NC 4.0, ce qui offre la possibilité aux chercheurs de l’améliorer. Meta a déclaré que SeamlessM4T représente “une avancée significative”, car ce nouveau modèle effectue l’ensemble de la tâche de traduction en une seule fois, contrairement à d’autres grands modèles de traduction qui répartissent la traduction entre différents systèmes. Aussi, le système est capable de détecter les changements de langue en cours de route, y compris au sein d’une seule phrase. La traduction est importante pour des entreprises comme Meta, qui emploie des milliers de personnes pour modérer le flot de messages publié dans différentes langues sur ses différentes plateformes.
⇨ The Verge, Emilia David, “Meta releases multilingual speech translation model.”
⇨ Ars Technica, Benj Edwards, “Meta’s ‘massively multilingual’ AI model translates up to 100 languages, speech or text.”
2023-08-22