Datorerna som lyssnar
Särskilda program som gör att en dator förstår vad som sägs tillden kan mycket väl bli nästa stora konsumentprodukt iprogramvarubranschen. Och kanske till och med påverkautvecklingen i hela branschen. Jättar som IBM och Microsoftsatsar båda hårt på området, väl medvetna om att derasoperativsystem måste anpassas till att förstå tal, på samma sättsom operativsystemen snabbt skulle göras grafiska för sådär enfem år sedan för att inte tappa mark till dåtidens uppstickare,Apple. Och när dessa spelare ger sig in på en marknad är det föratt sätta en standard som i sin tur vanligtvis skapar enmassmarknad och lägre priser.
Ett taligenkänningsprogram gör det möjligt att kommunicera meden dator med rösten istället för, som idag, med ett tangentbordeller en mus. Det givna användningsområdet är att datorn blirersättning för en sekreterare. Istället för att diktera ett brev,eller knacka sig fram med pekfingervalsen, går det att tala inbrevet som automatiskt skrivs i ett ordbehandlingsprogram.
Men företagen bakom tekniken tror särskilt på att integrera denmed nya elektronikprodukter, exempelvis små handdatorer,mobiltelefoner och navigationssystem. Här är det särskiltlämpligt, eftersom traditionella tangentbord skulle bli för småför att vara bekväma. Dessutom används dessa produkter när folkbefinner sig i rörelse. Att då kunna utföra kommandon med talistället för med knappar är en avsevärd förenkling, trorföretagen.
Att bygga upp ett taligenkänningsprogram från scratch kräver ettenormt utvecklingsarbete som kan ta flera år. Meningar, ord ochstavelser måste matas in i programmets register. Stavelsernalåter dessutom olika, beroende på i vilket ord och vilketsammanhang de sägs i. Omfattningen av programmen blir dessutominte mindre av att människor har olika dialekter och olika sättatt tala, exempelvis utlänningar som just har lärt sig ett nyttspråk. Och för varje nytt språk måste proceduren upprepas.Därför är det bara lönsamt att utveckla taligenkänningsprogramför de största världsspråken. Något bra program för svenska fårvi nog vänta på.
Programmerarna utnyttjar forskningsresultat inom områdetartificiell intelligens, som i sin tur baseras på kunskapen omhur den mänskliga hjärnan fungerar, neurologi.
Taligenkänningsprogrammen är konstruerade för att lära sig ochutvecklas då de används, exempelvis genom att känna igen en visspersons sätt att tala. Det gör att de blir bättre och snabbareju mer de används av en och samma person.
En metod, utvecklad av den ryske matematikern Andrei Markov,används också vid utvecklingen av taligenkänningssystem. Det ären metod för att bedöma vilka ord som är mer sannolika än andraatt följa efter ett visst ord i en särskild mening. För datornblir det betydligt enklare att matcha ett talat ord med någotord från minnet om den först och främst väljer bland de ord sommest sannolikt står på tur. Det gör programmen snabbare ochträffsäkerheten högre.
Forskning kring datorer som förstår tal har bedrivits ända sedan1950-talet. Inte minst den amerikanska armén spenderade storasummor på forskning kring tekniken under 1970-talet. De förstakommersiella produkterna var starkt begränsade. Datorn kundebara känna igen ett begränsat antal ord och användarna vartvungna att tala långsamt och på ett särskilt sätt för attdatorn skulle kunna förstå.
De senaste två-tre åren har utvecklingen gått fort. Idag finnsdet program som enligt tester genomsnittligt förstår 98 procentav alla ord någon säger (på engelska). Användarna behöver hellerinte längre lägga ned lång tid på att lära sig tala på ett visstsätt. Förklaringen till genombrottet är den snabba utvecklingenpå persondatorområdet. Kraftfullare och snabbare datorer, medallt större minneskapacitet, klarar plötsligt av att behandladen enorma mängd information som ett taligenkänningsprogramkräver.
I USA har programmen börjat sälja stort i år. I New York varprogrammet Naturally Speaking från amerikanska företaget DragonSystems det näst mest sålda programmet under sommaren, slagetbara av Apple som just lanserat ett nytt operativsystem.Analytiker är överens om att programmen står inför sittgenombrott på en massmarknad. Ett analyshus värderar marknadentill 4 miljarder dollar år 2001.
Nämnda Dragon Systems är, tillsammans med IBM och Belgiskaföretaget Lernout & Hauspie, helt dominerande spelare på den härmarknaden. De lär så förbli för ett bra tag. Inträdesbarriärernaär nämligen minst sagt höga på grund av den tidskrävande ochdyra utveckling som krävs. Dessa tre spelare slåss nu med näbbaroch klor om marknaden. I USA har det till och med blossat uppett priskrig, där IBM har dumpat priserna under året. För IBM ärnämligen taligenkänning av stor strategisk vikt. Bolagetinvesterar tungt på området, som det ser som en del i någontingstörre. IBM har helt förlorat den viktiga marknaden föroperativsystem till Microsoft med Windows. Men på samma sätt somdet nu är självklart att ett operativsystem är grafiskt tror IBMatt det i framtiden ska vara lika naturligt att datorn, viaoperativsystemet som ju styr alla program, ska kunna förståtalade kommandon. IBM är mycket aktivt i att licensiera ut sintaligenkänningsteknologi till programvaruhus för att såsmåningom skapa en standard.
Men Microsoft ligger inte heller på latsidan, utan har också sommål att skapa en standard på området. Bolaget har framför alltett nära samarbete med Lernout & Hauspie, där det köpt in sigmed 8 procent. De två ska tillsammans utveckla talsystem för dennya versionen av Microsofts operativsystem, Windows 98. Lernout& Hauspie har tidigare försett Microsoft med översättningar tillflera olika språk av Microsofts alla program.
Dragon Systems samarbetar också med Microsoft, som harintegrerat Dragons taligenkänningssystem med ett fåtal program.Dragon Systems är privatägt och har inte tillgång till sammaresurser som exempelvis IBM. Därför har det svårt att hänga mednär IBM snabbt sänker priset på sitt taligenkänningsprogram. MenDragon Systems lever på sitt programs höga träffsäkerhet när detgäller att känna igen ord, samt programmets stora ordregister.Enligt den engelska branschtidningen Computer Business Review ärDragon Systems program marknadens bästa.
Kommentera artikeln
I samarbete med Ifrågasätt Media Sverige AB (”Ifrågasätt”) erbjuder Afv möjlighet för läsare att kommentera artiklar. Det är alltså Ifrågasätt som driver och ansvarar för kommentarsfunktionen. Afv granskar inte kommentarerna i förväg och kommentarerna omfattas inte av Affärsvärldens utgivaransvar. Ifrågasätts användarvillkor gäller.
Grundreglerna är:
- Håll dig till ämnet
- Håll en respektfull god ton
Såväl Ifrågasätt som Afv har rätt att radera kommentarer som inte uppfyller villkoren.