TOTAL översättningsbyrå

Är maskinöversättning ett alternativ?

Maskinöversättning: Ett realistiskt och användbart alternativ?

En professionell översättares arbete kan vid en första anblick verka okomplicerat, men bakom varje enskild översättning döljer sig en komplex kedja av kognitiva och kreativa operationer. Inom forskningsfältet datalingvistik har det långsiktiga målet länge varit att skapa helautomatisk maskinöversättning som håller en kvalitet jämförbar med en mänsklig expert. Även om stora framsteg har gjorts, återstår betydande utmaningar innan detta mål kan uppnås fullt ut. Med detta i åtanke inställer sig frågan: är maskinöversättning ett genomförbart och praktiskt alternativ med dagens teknik?

För att kunna besvara den frågan behöver vi först analysera den mänskliga översättningsprocessen och förstå de utmaningar som en programvara måste övervinna för att kunna replikera den.

Översättningsprocessens inneboende komplexitet

En professionell mänsklig översättare måste besitta en djupgående och nyanserad förståelse för både källtexten och källspråket. Detta innefattar flera centrala kunskapsområden:

Grammatik – Den uppsättning formella regler som styr hur ett språk är uppbyggt och används korrekt. Detta inkluderar böjningsformer, meningsstruktur och ordföljd.

Syntax – De specifika regler som bestämmer hur ord och fraser kombineras för att bilda grammatiskt korrekta och logiskt sammanhängande meningar. Skillnader i syntax mellan språk är en vanlig källa till fel i maskinöversättning.

Idiom och kollokationer – Idiomatiska uttryck är fraser och talesätt vars betydelse inte kan utläsas av de enskilda orden (till exempel det svenska uttrycket ”att glida in på en räkmacka”). Kollokationer är ord som naturligt hör ihop (t.ex. ”fatta ett beslut” snarare än ”göra ett beslut”). Båda kräver ingående kunskap om språket och dess lokala användning.

Semantik och polysemi – Semantik är studiet av betydelser i språk. En stor utmaning är polysemi, det vill säga att ett enskilt ord kan ha flera olika betydelser beroende på sammanhanget. En översättare måste kunna tolka vilken betydelse som avses för att välja rätt motsvarighet på målspråket.

Kulturell kontext och pragmatik – Språket existerar inte i ett vakuum. För att förstå nyanser, referenser och underliggande mening krävs en förståelse för den sociala och kulturella grund texten vilar på. Detta inkluderar allt från formalitetsnivåer och artighetsfraser till historiska referenser och sociala normer som styr kommunikationen hos en viss folkgrupp.

När översättaren har analyserat och tillgodogjort sig källtexten utifrån dessa aspekter kan hen påbörja arbetet med att överföra budskapet till målspråket. Målet är att skapa en korrekt och meningsfull översättning som är funktionellt och stilistiskt anpassad för den avsedda mottagaren och kulturen.

Vilken teknik använder maskinöversättningsmotorerna?

För att försöka efterlikna den komplexa mänskliga processen har flera olika tekniska metoder utvecklats för maskinöversättning under årens lopp.

Ordboksbaserad översättning

Den första och mest grundläggande metoden fungerar i princip som en digital ordbok som översätter ord för ord, ibland med tillägg av mycket enkla grammatiska regler. Detta tillvägagångssätt resulterar nästan undantagslöst i obegripliga eller mycket bristfälliga texter utan naturligt flöde eller korrekt sammanhang, eftersom det ignorerar syntax och semantiska nyanser. Metoden används sällan fristående idag men kan utgöra en grundkomponent i andra system.

Statistisk maskinöversättning (SMT)

Under många år var detta den dominerande metoden för kommersiell maskinöversättning. SMT bygger på att analysera enorma mängder textdata, så kallade textkorpusar, som redan har översatts av människor. Genom att statistiskt analysera dessa parallella texter ”lär sig” systemet sannolikheten för hur ett visst ord eller en viss fras ska översättas i ett givet sammanhang. SMT arbetar med textfragment och väljer den mest sannolika översättningen baserat på statistiska modeller.

Regelbaserad maskinöversättning via interlingua

Med denna metod analyseras källtexten grammatiskt och omvandlas först till en språkoberoende mellanrepresentation, ett slags universellt symbolspråk (interlingua). Därefter genereras texten på målspråket utifrån denna abstrakta representation. Konceptet är teoretiskt elegant och centralt inom utvecklingen av artificiell intelligens, men har i praktiken visat sig vara extremt svårt att implementera effektivt för komplexa språk.

Neural maskinöversättning (NMT)

Detta är den moderna standarden som har revolutionerat fältet under det senaste årtiondet. NMT använder avancerade modeller baserade på djupa neurala nätverk, vilka är inspirerade av den mänskliga hjärnans funktionssätt. Till skillnad från SMT, som bryter ner meningar i mindre delar, kan NMT-modeller analysera hela meningen (och ibland omgivande meningar) för att fånga upp ett bredare sammanhang. Detta resulterar i översättningar med betydligt bättre flyt, högre grammatisk korrekthet och en överlägsen förmåga att hantera idiomatiska uttryck jämfört med tidigare tekniker.

Är maskinöversättning ett praktiskt alternativ i dag?

Svaret på den frågan är numera tudelat: det beror helt på syftet och kvalitetskraven.

Å ena sidan kvarstår problemet att språk, trots sina regler, är fyllt av variation, kreativitet och undantag som styrs av mänsklig erfarenhet. Människor har unika och varierade sätt att uttrycka sig, vilket gör det oerhört svårt för algoritmer att fullt ut hantera nyanser, undertext och avsedd stilistisk effekt. För texter som kräver hög precision, kulturell anpassning, kreativitet eller har juridiska implikationer är maskinöversättning inte ett tillförlitligt fristående alternativ.

Å andra sidan, tack vare NMT-teknikens framsteg, kan maskinöversättning för vanliga språkkombinationer producera ett förvånansvärt användbart resultat för specifika ändamål. Det kan användas för att snabbt få fram en råöversättning av stora textmängder för internt bruk eller för att förstå andemeningen i en text på ett främmande språk.

Denna råöversättning måste dock nästan alltid överlämnas till en mänsklig översättare för omfattande granskning och korrigering om texten ska publiceras externt. Denna process kallas efterredigering (post-editing). Det är dock viktigt att poängtera att detta efterarbete ofta tar lika lång tid, eller till och med längre, än att översätta texten från grunden. Anledningen är att översättaren inte bara korrigerar enstaka fel, utan ofta måste omstrukturera hela meningar som är grammatiskt korrekta men semantiskt felaktiga i sitt sammanhang.