O Seamless M4T trabalha com texto e linguagem, com possibilidades diversas:
- reconhecimento de fala para quase 100 idiomas;
- tradução de fala para texto para quase 100 idiomas de entrada e saída;
- tradução de fala para fala para quase 100 idiomas de entrada e 36 de saída;
- tradução de texto para texto para quase 100 idiomas;
- tradução de texto para fala para quase 100 idiomas de entrada e 35 de saída.
Para criar o modelo, a Meta diz ter coletado dezenas de bilhões de frases escritas e 4 milhões de horas de fala disponíveis publicamente na web.
Ao site Axios, Paco Guzmán, pesquisador da Meta, diz que o Seamless M4T não usa modelos intermediários e aceita até mesmo mudanças de idioma no meio da frase.
“Isso permite que ele funcione melhor com populações que naturalmente misturam línguas no dia a dia”, comenta Guzmán.
O novo modelo da Meta não está disponível para qualquer pessoa usar. Ele foi liberado sob licença Creative Commons, para uso não-comercial. Pesquisadores e desenvolvedores poderão usar a tecnologia em seus trabalhos.
Meta e concorrentes investem em IA para tradução
Esta não é a primeira vez que a Meta desenvolve modelos de inteligência artificial para trabalhar com tradução.
Em 2022, a empresa lançou o No Language Left Behind, para traduções de texto para texto. Ele chegou a ser capaz de traduzir 200 idiomas.
Em seguida, veio o Universal Speech Translator, que funcionava com fala na entrada e na saída.
O Seamless M4T usa como base o Massively Multilingual Speech, framework da Meta para reconhecimento de fala, identificação de idioma e síntese de voz para mais de 1.100 línguas.
Entre as concorrentes, o Google trabalha no Universal Speech Model, uma iniciativa para compreender as 1.000 línguas mais faladas do mundo.
Já a Mozilla lidera o projeto Common Voice, uma coleção de vozes de diversos idiomas, para treinar algoritmos de reconhecimento de fala.
Com informações: Meta, Axios, TechCrunch, Reuters
Meta cria IA capaz de traduzir e transcrever quase 100 idiomas
You must be logged in to post a comment.