Meta, het moederbedrijf van Facebook, heeft een doorbraak bereikt in automatisch vertalen. Het bedrijf presenteerde deze week een AI-systeem dat spraak en tekst direct kan vertalen tussen maar liefst 101 talen. Het systeem, SeamlessM4T genoemd, komt daarmee in de buurt van de 'universele vertaler' die we kennen uit sciencefiction.
"Sciencefiction geeft ons een duidelijk doel om naartoe te werken," zegt onderzoeker Marta Costa-jussà van Meta's AI-team. Het nieuwe systeem presteert indrukwekkend: bij spraak-naar-spraak vertalingen is het tot 23 procent nauwkeuriger dan bestaande systemen. Bovendien is het beter bestand tegen achtergrondgeluid en kan het zelfs zinnen vertalen waarin verschillende talen door elkaar worden gebruikt.
Meta trainde het AI-systeem met 4 miljoen uur aan meertalige audio en tientallen miljarden zinnen van het internet. Ook analyseerde het 443.000 uur aan video met ondertiteling om de vertalingen te verbeteren. Het bedrijf heeft extra aandacht besteed aan het voorkomen van ongepast taalgebruik in de vertalingen, wat volgens tests met 20 procent is verminderd.
Het systeem wordt al gebruikt om video's op Instagram en Facebook automatisch te ondertitelen. Ook maakt het realtime vertalingen mogelijk via slimme Ray-Ban brillen, die Spaans, Frans of Italiaans direct naar het Engels kunnen omzetten. Meta stelt de technologie beschikbaar voor niet-commercieel gebruik om verder onderzoek te stimuleren.
Toch is er nog werk aan de winkel voordat we echt een universele vertaler hebben. Het systeem ondersteunt nu ongeveer 100 talen, maar wereldwijd worden er ongeveer 6.500 talen gesproken. Ook moet er nog een oplossing komen voor bepaalde vooroordelen in het systeem, zoals bij het vertalen van genderneutrale zinnen naar talen met grammaticaal geslacht.
Bron: IEEE Spectrum