TOTAL översättningsbyrå

Google diversifierar sin översättningstjänst och lägger till 24 språk

Google utökar sin översättningstjänst med 24 nya språk

Google har nyligen genomfört en av sina största expansioner någonsin för tjänsten Google Översätt genom att lägga till 24 nya språk. Expansionen fokuserar på språk från Sydamerika, Afrika och Sydasien som ofta är underrepresenterade i tekniska sammanhang. Detta initiativ kan spela en viktig roll för att bevara dessa språk, även om utmaningar kvarstår när det gäller att fånga alla kulturella nyanser i en automatiserad översättning.

En seger för underservade språk

För de cirka 10 miljoner människor som talar quechua har det länge varit nästan omöjligt att automatiskt översätta digital kommunikation som e-post och textmeddelanden. Quechua är den mest talade inhemska språkfamiljen i Amerika, men har saknat stöd i de flesta digitala verktyg. Detta förändrades när Google lade till quechua tillsammans med andra sydamerikanska språk som guarani och aymara.

Enligt internetjätten är det ny teknik inom artificiell intelligens som har gjort det möjligt att kraftigt utöka språkbiblioteket. Utvecklare på Google förklarade att de medvetet siktade in sig på språk med ”mycket stora, underförsörjda befolkningar”. Nyheten, som presenterades vid företagets årliga I/O-konferens, har mottagits positivt i många delar av världen, men väcker också frågor kring hur väl tekniken kan hantera språkliga och kulturella nyanser.

Quechua var Inkarikets officiella språk, med ett utbredningsområde från dagens södra Colombia till centrala Chile. Språkets status har dock minskat sedan den spanska erövringen av Peru för över 400 år sedan. Att Google nu inkluderar språket ses som en stor seger för aktivister som arbetar för att bevara och främja det. Det förväntas bidra till att ge quechua en status som är mer likvärdig med spanskan och samtidigt hålla språket levande hos en ny generation som är aktiv på sociala nätverk.

Ny AI-teknik möjliggör expansionen

Det tekniska framsteget är betydande. Tidigare har det varit en förutsättning att det finns en stor mängd digital text – såsom böcker, nyhetsartiklar och inlägg på sociala medier – för att ett AI-system ska kunna lära sig ett nytt språk. Detta har historiskt missgynnat språk på marknader utanför de rikaste regionerna. Fram till nyligen erbjöd Google Översätt stöd för relativt små europeiska språk som frisiska och isländska, men saknade stöd för östafrikanska språk som oromo och tigrinya, vilka talas av miljontals människor.

Expansionen möjliggjordes av en modell för maskinöversättning som Google kallar ”zero-resource machine translation”. Denna modell lär sig att översätta till ett nytt språk utan att först ha sett direkta översättningsexempel. Systemet tränas på cirka 100 språk med stora datamängder och kan sedan applicera denna kunskap på hundratals andra språk som saknar data. Man kan likna det vid en person som redan kan många språk och därför kan börja förstå en text på ett helt nytt språk genom att dra slutsatser baserade på sin allmänna språkkunskap.

Även Metas, moderbolaget till Facebook och Instagram, har introducerat ett liknande koncept under namnet Universal Speech Translator.

Kvalitetsutmaningar och framtida möjligheter

Google är öppna med att kvaliteten på översättningarna för de nya språken ännu inte når upp till samma nivå som för etablerade språk som engelska, spanska och tyska. Företaget varnar för att modellerna kan göra misstag och feltolkningar, men betonar att ett språk endast läggs till om AI-systemet uppnår en viss grundläggande kompetenströskel.

Även om de nya språken nu finns tillgängliga för textöversättning, kan de ännu inte hanteras av Googles röstassistent. Företaget uppger att man arbetar på att implementera taligenkänning och andra funktioner, som att kunna översätta en skylt genom att rikta mobilkameran mot den. Detta ses som särskilt viktigt för traditionellt muntliga språk som quechua, inte minst inom hälso- och sjukvården där språkbarriärer kan uppstå mellan patienter och personal på landsbygden i länder som Peru.

Digital närvaro avgörande för språks överlevnad

Redan 2006 fick Microsoft positiv uppmärksamhet i Sydamerika för en programfunktion som översatte menyer och kommandon till quechua, men det var långt före den nuvarande AI-drivna utvecklingen inom realtidsöversättning. Språkforskare menar att Googles initiativ ger språken en nödvändig synlighet i en digital värld. För många av dessa språk kan överlevnaden på lång sikt hänga på just deras närvaro och användbarhet i digitala sammanhang.

De 24 nya språken i Google Översätt

De nya språken som har lagts till är: assamesiska, aymara, bambara, bhojpuri, divehi, dogri, ewe, guarani, ilocano, konkani, krio, lingala, luganda, maithili, meitei (manipuri), mizo, oromo, quechua, sanskrit, sepedi, sorani, tigrinya, tsonga och twi.