EU:s översättningsminne – en språklig guldgruva för alla
Europeiska kommissionen har sedan flera år tillbaka gjort en ovärderlig språkresurs tillgänglig för allmänheten: DGT-Translation Memory. Detta är ett gigantiskt översättningsminne som ursprungligen innehöll en miljon meningar, men som idag har vuxit till att omfatta miljarder segment med högkvalitativa översättningar mellan EU:s officiella språk. Resursen är helt gratis att använda och utgör en hörnsten för utvecklingen inom språkteknologi i Europa och världen.
Vad är DGT-Translation Memory?
Ett översättningsminne (TM) är en databas som lagrar textsegment (oftast meningar eller fraser) och deras motsvarande översättningar. När en översättare arbetar med en ny text kan översättningsminnet automatiskt föreslå tidigare gjorda översättningar för identiska eller liknande meningar, vilket sparar tid och säkerställer konsekvens.
Det unika med DGT-TM är dess källa. Informationen är hämtad från Acquis Communautaire, det vill säga hela den samling av lagar, förordningar och juridiska texter som utgör EU:s regelverk. Eftersom dessa texter måste finnas på vart och ett av de 24 officiella språken (med vissa undantag för irländska) har EU-institutionerna byggt upp en större flerspråkig textdatabas än någon annan organisation i världen. Kvaliteten på dessa översättningar är extremt hög då de är utförda av professionella och granskade översättare.
En resurs i ständig utveckling
Vid det ursprungliga offentliggörandet innehöll databasen en miljon meningar på 22 språk. Redan då såg man den enorma potentialen. Leonard Orban, dåvarande EU-ledamot för flerspråkighet, kommenterade initiativet:
“Genom detta initiativ försöker den Europeiska kommissionen att förbättra teknologin för mänskliga språk, stödja flerspråkigheten och göra datoröversättning enklare, billigare och mer tillgänglig.”
Sedan dess har databasen uppdaterats och utökats regelbundet och är nu många gånger större, vilket speglar både den fortsatta lagstiftningen inom EU och unionens utvidgning.
Betydelse för språkindustri och forskning
Att göra denna enorma mängd språkdata fritt tillgänglig har haft stor betydelse. Informationen är ovärderlig för utvecklare av maskinöversättningssystem (MT), som använder datan för att träna sina algoritmer. Ju mer högkvalitativ data ett system tränas på, desto bättre blir resultatet. Utöver maskinöversättning används databasen även för att utveckla och förbättra andra lingvistiska mjukvaruverktyg, såsom:
- Grammatik- och stavningskontroller
- Avancerade onlineordböcker
- System för flerspråkig textklassificering
Janez Potočnik, som företrädde Europeiska forskningskommissionen, underströk vikten av initiativet redan från start:
“Denna unika sammanställning av språkdata hjälper till vid skapandet av den nya generationens mjukvaruverktyg för hantering av mänskliga språk och bidrar till att gynna konkurrenskraften inom språkindustrin.”
Genom att tillhandahålla DGT-TM fortsätter Europeiska kommissionen att spela en aktiv roll i att främja teknologisk innovation och stödja den språkliga mångfalden som är en av EU:s grundpelare.




