TOTAL översättningsbyrå

IBM:s mänskligaste dataröst gör skeppsdatorn HAL avundsjuk

Innehållsförteckning

Att få en dator att generera ljud som påminner om mänskligt tal är relativt enkelt. Men att göra ett dataljud övertygande mänskligt är mycket svårt.

Ändå påstår IBM att de har kodat en syntetisk röst som är mer människolik än någon annan tidigare dataröst. Dess nivå av mänsklig efterapning är så hög att den till och med kopierar vanliga fel genom att humma, staka sig och till och med sucka. Om den kräver din uppmärksamhet kan den till och med hosta till och hyssja när du avbryter.

Den nyligen patenterade tekniken ”genererar paralingvistiska fenomen via markup i text-till-talsynteser” och är utformad för användning i automatiska telefonsystem, GPS-enheter och möjligen även mobiltelefoner. Dess sofistikering ligger i den paralingvistiska delen av namnet: dessa oförfalskade ljud som gör en mänsklig röst unik. Som Andy Aaron från IBM:s röstforskningsteam säger: ”Dessa ljud kan vara otroligt subtila, till och med omärkliga, men har en djup psykologisk effekt.” Systemet kan pausa för effekt, reagera på situationer genom att ändra rösten och lära sig nya ljud som den sedan placerar i rätt del av en mening.

Begriplighet har uppnåtts i syntetiska röster under årtionden, från den första sjungande datorn och den klassiska skeppsdatorn HAL. Men dessa talande maskiner är uppenbarligen inte mänskliga, vilket kan göra att man misstror dem eller tycka illa om att lyssna på dem.

Medan dagens apparater blir alltmer sofistikerade finns det ett signifikant utrymme för IBM:s typ av talteknologi. Att ha en GPS-enhet som hostar till lite nätt och förklarar för dig att du precis har missat att svänga, snarare än ett hårt meddelande som beräknar om vägen, skulle vara betydligt bättre. Ett automatiskt telefonsystem som faktiskt lät mindre som en steril maskin skulle inte heller skada.

Det verkliga testet för IBM:s nya röst är om den är bättre än den mest berömda datarösten av alla: HAL 9000 från 1968-filmen 2001: Ett rymdäventyr (A Space Odyssey). Även om rösten utfördes av en skådespelare som Stanley Kubrick och Arthur C. Clarke tyckte passade för datorns omisskännliga syntetiska röst talar skeppsdatorn HAL i en orubbligt lugn ton och i ett mycket sansat tempo. Den varken hummar, stakar sig eller hostar. Och det är någonting som IBM är noggranna också – de vill inte att rösten ska passera den kusliga gränsen där den fullt ut efterapar en person. ”Vi befinner oss nästan på den punkt där rösten är omöjlig att särskilja från en mänsklig, men det är inte vårt mål”, säger Andy Aaron. ”Vi vill inte lura någon.”

error:
TOTAL
Sök