Google Translate aggiunge 110 nuove lingue

Google Translate aggiunge 110 nuove lingue

Google ha annunciato oggi che Google Translate ora supporta 110 lingue aggiuntive. L’aggiunta più notevole è il cantonese che conta oltre 85 milioni di parlanti.

L’azienda sottolinea che il suo modello linguistico di grandi dimensioni PaLM 2 è stato fondamentale per aiutare Translate ad apprendere in modo più efficiente lingue strettamente correlate.

Nel 2022, abbiamo aggiunto 24 nuove lingue utilizzando la traduzione automatica Zero-Shot, in cui un modello di apprendimento automatico impara a tradurre in un’altra lingua senza nemmeno vedere un esempio. E abbiamo annunciato la 1.000 Languages ​​Initiative, un impegno per costruire modelli di intelligenza artificiale che supporteranno le 1.000 lingue più parlate nel mondo. Ora utilizziamo l’intelligenza artificiale per espandere la varietà di lingue che supportiamo. Grazie al nostro modello linguistico di grandi dimensioni PaLM 2, stiamo implementando 110 nuove lingue in Google Translate, la nostra più grande espansione di sempre.

Google Translate aggiunge 110 nuove lingue

Supporto alla traduzione per oltre mezzo miliardo di persone
Dal cantonese al Qʼeqchiʼ, queste nuove lingue rappresentano più di 614 milioni di parlanti, aprendo le traduzioni a circa l’8% della popolazione mondiale. Alcune sono le principali lingue del mondo con oltre 100 milioni di parlanti. Altri sono parlati da piccole comunità di indigeni, e alcuni non hanno quasi madrelingua ma sono attivi sforzi di rivitalizzazione. Circa un quarto delle nuove lingue provengono dall’Africa, rappresentando la nostra più grande espansione di lingue africane fino ad oggi, tra cui Fon, Kikongo, Luo, Ga, Swati, Venda e Wolof.

Ecco alcune delle nuove lingue supportate in Google Traduttore:

● L’afar è una lingua tonale parlata a Gibuti, Eritrea ed Etiopia. Di tutte le lingue in questo lancio, l’afar ha avuto il maggior numero di contributi volontari della comunità.
● Il cantonese è da tempo una delle lingue più richieste per Google Traduttore. Poiché il cantonese spesso si sovrappone al mandarino nella scrittura, è difficile trovare dati e addestrare modelli.
● Manx è la lingua celtica dell’Isola di Man. Si è quasi estinto con la morte del suo ultimo madrelingua nel 1974. Ma grazie a un movimento di rinascita a livello dell’isola, ora ci sono migliaia di parlanti.
● NKo è una forma standardizzata delle lingue mandinghe dell’Africa occidentale che unifica molti dialetti in una lingua comune. Il suo alfabeto unico è stato inventato nel 1949 e ha una comunità di ricerca attiva che oggi sviluppa risorse e tecnologia per esso.
● Punjabi (Shahmukhi) è la varietà di Punjabi scritta in caratteri perso-arabi (Shahmukhi) ed è la lingua più parlata in Pakistan.
● Il Tamazight (Amazigh) è una lingua berbera parlata in tutto il Nord Africa. Sebbene esistano molti dialetti, la forma scritta è generalmente reciprocamente comprensibile. È scritto in caratteri latini e in caratteri Tifinagh, entrambi supportati da Google Translate.
● Tok Pisin è un creolo di base inglese e la lingua franca della Papua Nuova Guinea. Se parli inglese, prova a tradurre in Tok Pisin: potresti riuscire a capirne il significato!

Maggiori dettagli al link sottostante…

Per saperne di più

Google Translate aggiunge 110 nuove lingue