TOTAL översättningsbyrå

Google diversifierar sin översättningstjänst och lägger till 24 språk

Innehållsförteckning

I veckan lade Google till 24 språk till sin översättningstjänst, inklusive sydamerikanska, afrikanska och sydasiatiska språk som vanligen inte går att hitta på populära tekniska produkter. Det kan bidra till att hålla språken vid liv, men vissa kulturella nyanser kanske inte kan översättas.

Omkring 10 miljoner människor talar quechua, men det var länge nästan omöjligt att automatiskt översätta e-post och textmeddelanden till den mest talade inhemska språkfamiljen i Amerika.

Detta ändrades i onsdags när Google lade till quechua och en rad andra språk till sin digitala översättningstjänst.

Internetjätten säger att ny teknik för artificiell intelligens gör det möjligt att kraftigt utöka Google Översätts repertoar av världens språk. I veckan lades 24 nya språk till, däribland quechua och andra sydamerikanska språk som guarani och aymara. Dessutom läggs ett antal vanliga afrikanska och sydasiatiska språk till som har saknats i populära teknikprylar.

Vi tittade på språk med mycket stora, underförsörjda befolkningar, berättade utvecklare på Google för reportrar.

Nyheten från det kaliforniska företagets årliga I/O-event kan firas i många hörn av världen. Men det kommer troligen också att få kritik från dem som är frustrerade över tidigare tekniska produkter som inte lyckats förstå nyanserna i deras språk eller kultur.

Quechua var språket i inkariket, som sträckte sig från nuvarande södra Colombia till centrala Chile. Dess status började sjunka efter den spanska erövringen av Peru för mer än 400 år sedan.

Att lägga till språket bland de språk som erkänns av Google är en stor seger för quechua-aktivister, till exempel de som skapat webbplatsen qichwa 2.0, som innehåller ordböcker och resurser för att lära sig språket.

Det kommer att bidra till att quechua och spanska får samma status, som inte var inblandad i Googles projekt.

Vars efternamn på quechua betyder ”du är blixten”, säger översättaren och det kommer också att hjälpa till att hålla språket vid liv hos en ny generation ungdomar och tonåringar, som talar quechua och spanska samtidigt och som är fascinerade av sociala nätverk.

Han kallade nyheten för ett mycket stort tekniskt framsteg eftersom det fram till nyligen inte har varit möjligt att lägga till språk om forskarna inte kunde hitta en tillräckligt stor mängd text på nätet t.ex. digitala böcker, tidningar eller inlägg i sociala medier som deras AI-system kunde lära sig från.

De amerikanska teknikjättarna har historiskt inte anpassat sin språkteknologi för att fungera bra utanför de rikaste marknaderna, vilket också har gjort det svårare för dem att upptäcka farlig felaktig information på sina plattformar. Fram till den här veckan erbjöds Google Översätt för europeiska språk som frisiska, maltesiska, isländska och korsikanska (alla med färre än en miljon talare) men inte för östafrikanska språk som oromo och tigrinya, som har flera miljoner talare.

De nya språken kommer att lanseras denna vecka. De kan ännu inte förstås av Googles röstassistent, vilket begränsar dem till översättningar från text till text för tillfället. Google nämner att man arbetar på att lägga till taligenkänning och andra funktioner, till exempel att översätta en skylt genom att rikta en kamera mot den.

Detta kommer att vara viktigt för språk som talas i stor utsträckning, som quechua, särskilt inom hälso- och sjukvården, eftersom många peruanska läkare och sjuksköterskor som endast talar spanska arbetar på landsbygden och inte kan förstå patienter som huvudsakligen talar quechua.

Nästa utmaning, är att arbeta med talfunktioner. De inhemska språken i Amerika är traditionellt muntliga.

I sitt tillkännagivande varnade Google för att kvaliteten på översättningarna till de nya språken fortfarande ligger långt efter andra språk som stöds, till exempel engelska, spanska och tyska, och påpekade att modellerna kommer att göra misstag och uppvisa feltolkningar. Men företaget lade bara till språk om dess AI-system uppfyllde en viss kompetenströskel.

Om det finns ett stort antal fall där det är mycket fel, skulle vi inte ta med det. Även om 90 procent av översättningarna är perfekta, men 10 procent är nonsens, är det lite för mycket för oss.

Google säger att dess produkter nu stöder 133 språk. De 24 nya språken är det största partiet som lagts till sedan Google införde 16 nya språk 2010. Det som gjorde expansionen möjlig är vad Google kallar en modell för maskinöversättning med noll resurser – en modell som lär sig att översätta till ett annat språk utan att någonsin ha sett ett exempel på det.

Facebooks och Instagrams moderbolag Meta introducerade ett liknande koncept kallat Universal Speech Translator förra året.

Googles modell fungerar genom att träna en enda gigantisk neural AI-modell på cirka 100 datarika språk och sedan tillämpa det den lärt sig på hundratals andra språk som den inte känner till. Tänk dig att du kan en mängd språk och sedan börjar läsa romaner på ett annat språk, så kan du börja sätta ihop vad det kan betyda baserat på din kunskap om språk i allmänhet.

Den nya gruppen språk inbegriper mindre språk som mizo, som talas i nordöstra Indien av cirka 800 000 personer, till mer utbredda språk som lingala, som talas av cirka 45 miljoner människor i centrala Afrika.

Det var för mer än 15 år sedan, 2006 närmare bestämt, som Microsoft fick positiv uppmärksamhet i Sydamerika med en programvarufunktion som översatte välkända Microsoft-menyer och kommandon till quechua. Men det var före den nuvarande vågen av AI-utveckling inom översättning i realtid.

Språkforskare som talar quechua, säger att Googles uppmärksamhet ger språket en nödvändig synlighet på platser som Peru, där quechuatalare fortfarande saknas i många offentliga tjänster. Många av dessa språks överlevnad hänger på om de används i digitala sammanhang.

Observera: de nya språken som lagts till är: assamesiska, aymara, bambara, bhojpuri, divehi, dogri, ewe, guarani, ilocano, konkani, krio, lingala, luganda, maithili, meitei (manipuri), mizo, oromo, quechua, sanskrit, sepedi, sorani, tigrinya, tsonga och twi.

error:
TOTAL
Sök