Att välja rätt strategi för maskinöversättning: Tio frågor att ställa sig
Maskinöversättning (MT) har genomgått en revolution med introduktionen av neurala nätverk (NMT), vilket har höjt kvaliteten avsevärt för många tillämpningar. Trots detta är maskinöversättning inte en universallösning som passar alla typer av texter eller projekt. För att undvika kostsamma misstag och säkerställa att resultatet motsvarar förväntningarna är det avgörande att utvärdera ditt innehåll och dina processer noggrant. Här är tio grundläggande frågor du bör ställa dig innan du bestämmer dig för att implementera en maskinöversättningslösning.
1. Vilken språkkombination gäller det?
Trots de stora förbättringar i kvalitet som uppnåtts sedan NMT (Neural Machine Translation) lanserades, håller vissa språkkombinationer fortfarande en mycket högre kvalitet än andra. Språkpar med stora mängder tillgänglig träningsdata, som engelska till spanska eller tyska, tenderar att ge betydligt bättre resultat. Språk som det finns få tillgängliga digitala resurser för, såsom minoritetsspråk, regionala språk, utrotningshotade språk eller kulturarvsspråk, lämpar sig generellt sett dåligt för maskinöversättning eftersom träningsunderlaget är otillräckligt.
2. Är innehållet bokstavligt eller kreativt?
Om innehållet är tekniskt och informativt är det mycket troligare att maskinöversättning fungerar bra. Juridiskt innehåll, tekniska manualer eller bruksanvisningar är typiska områden som lämpar sig väl för maskinöversättning, förutsatt att källtexten är välskriven. Kreativt innehåll, å andra sidan, är som upplagt för problem. Marknadsföringstexter, skönlitteratur eller material som bygger på nyanser, kulturella referenser och ordlekar kräver mänsklig kreativitet och finkänslighet som dagens maskinöversättningsmotorer inte kan replikera. Att använda MT för en roman eller en reklamslogan riskerar att leda till ett platt eller direkt felaktigt resultat.
3. Är källmaterialet skannat eller lätt redigerbart?
Innan man satsar på maskinöversättning måste man noggrant väga de potentiella fördelarna mot kostnaderna för att förbereda indata så att maskinöversättningsmotorn kan generera ett bra resultat. Om källmaterialet består av skannade dokument måste dessa först genomgå en OCR-process (optisk teckenigenkänning) för att omvandlas till redigerbar text. Dålig skanningskvalitet leder till fel i OCR-tolkningen, vilket i sin tur försämrar källtexten som matas in i MT-motorn. Kostnader och tidsåtgång för detta förarbete kan i vissa fall överträffa de fördelar som maskinöversättningen erbjuder.
4. Hur håller grammatiken och stilen i källtexten?
Principen ”skräp in, skräp ut” är högst relevant för maskinöversättning. Man måste vara noggrann med meningsstruktur, grammatik och interpunktion när man utvecklar globalt innehåll som senare ska lokaliseras med hjälp av maskinöversättning. Särskilt inom vissa tekniska branscher kan det finnas en tendens att inte prioritera kvaliteten på det skriftliga originalmaterialet. En dålig kvalitet på inmatningen, med tvetydiga formuleringar eller grammatiska fel, leder oundvikligen till en dålig kvalitet på utmatningen från vilken maskin som helst, och översättningsmotorer är inget undantag.
5. Har innehållet enkel eller komplex formatering?
Vissa maskinöversättningslösningar kan ha svårt att hantera och återskapa komplex formatering från källdokumentet. Problem kan uppstå med tabeller, listor, inbäddad grafik och avancerad layout. Även om detta problem minskar i takt med att tekniken utvecklas, kan det fortfarande krävas manuellt efterarbete för att återställa dokumentets ursprungliga utseende efter översättningsprocessen. Utvecklingen går dock snabbt, och integrationen mellan översättningsverktyg och layoutprogram blir allt bättre.
6. Används klarspråk eller är texten mycket teknisk?
En enkel och korrekt grammatik förbättrar maskinöversättningens prestanda avsevärt. Teknisk terminologi har historiskt sett varit en utmaning, särskilt för standardiserade NMT-motorer som inte är tränade för en specifik bransch. Om en text innehåller mycket specialiserad terminologi krävs ofta en specialanpassad motor (se punkt 7) som har tränats med företagets egna termlistor för att uppnå konsekvens och korrekthet. För en allmän motor kan komplexa facktermer leda till gissningar eller inkonsekventa översättningar.
7. Bör en standardmotor eller en specialanpassad NMT-motor användas?
Valet mellan en standardmotor och en anpassad motor är avgörande för resultatet. En standardmotor (som de allmänt tillgängliga motorerna från Google eller DeepL) har tränats på en enorm mängd allmän text och fungerar bra för generellt innehåll. En specialanpassad motor tränas däremot specifikt på företagets eget material, inklusive tidigare översättningar och termdatabaser. Detta leder till högre precision för specifik terminologi och en mer konsekvent stil som matchar företagets röst. Läs gärna mer i vår artikel om olika typer av motorer och skillnaderna mellan standardmotorer och specialanpassade motorer.
8. Är ett översättningsminne ett bättre alternativ?
Maskinöversättning och översättningsminnen (Translation Memory, TM) fyller olika funktioner. Maskinöversättning är ett utmärkt alternativ när det rör sig om stora mängder helt nytt innehåll som behöver översättas snabbt. Om innehållet däremot ska uppdateras regelbundet är ett väl underhållet översättningsminne det viktigaste verktyget. Ett TM återanvänder tidigare godkända, mänskliga översättningar av identiska eller liknande textsegment. Detta säkerställer konsekvens över tid och är mer kostnadseffektivt för repetitivt innehåll. Moderna arbetsflöden kombinerar ofta TM och MT, där TM prioriteras och MT används för segment som saknar matchning.
9. Finns maskinöversättning redan integrerat i era arbetsflöden?
För att maskinöversättning ska vara effektivt behöver det integreras smidigt i befintliga system och arbetsflöden, oftast via ett API (Application Programming Interface). Numera erbjuder de flesta moderna översättningsverktyg (CAT-verktyg) integrationer med antingen standardmotorer eller anpassade motorer. Att ha en plan för teknisk integration är avgörande för att undvika manuella, tidskrävande steg som att kopiera och klistra text mellan olika plattformar. (För veteraner i branschen kan nämnas att GTT, Googles användbara översättningsverktyg, inte längre finns tillgängligt, och moderna API-lösningar har ersatt dess funktion).
10. Används stora bokstäver (versaler) i ditt innehåll?
En specifik teknisk begränsning som maskinöversättning fortfarande brottas med är hanteringen av versalisering (användning av stora bokstäver). Språk har olika regler för kapitalisering. En titel på engelska som använder ”Title Case” (stor bokstav i varje viktigt ord) blir till exempel enklast översatt till ett romanskt språk som franska eller spanska om man först konverterar källtexten till normal meningsbyggnad (stor bokstav i början) och sedan vid behov återskapar korrekt formatering i målspråket. Innehåll där versaler används flitigt för betoning eller definitioner, som till exempel i juridiska dokument, kan utgöra en allvarlig utmaning för MT-systemen, då de kan misstolka versala ord som egennamn eller akronymer.




