You are on page 1of 1

Die Forschung an Spracherkennungssystemen begann in den 1960er Jahren, verlief d

amals allerdings weitestgehend erfolglos: Die von privaten Firmen entwickelten S


ysteme ermglichten unter Laborbedingungen die Erkennung von einigen Dutzend Einze
lwrtern. Dies lag einerseits an dem begrenzten Wissen in diesem neuen Forschungsg
ebiet, aber auch an den zur damaligen Zeit begrenzten technischen Mglichkeiten.
Erst Mitte der 1980er Jahre kam die Entwicklung weiter voran. In dieser Zeit ent
deckte man, dass man durch Kontextprfungen Homophone unterscheiden konnte. Indem
man Statistiken ber die Hufigkeit bestimmter Wortkombinationen erstellte und auswe
rtete, konnte man bei hnlich oder gleich klingenden Wrtern entscheiden, welches ge
meint war. Diese so genannten Trigrammstatistiken wurden anschlieend ein wichtige
r Bestandteil aller Spracherkennungssysteme. 1984 stellte IBM ein erstes Sprache
rkennungssystem vor, das etwa 5.000 englische Einzelwrter erkennen konnte. Das Sy
stem brauchte fr einen Erkennungsvorgang jedoch mehrere Minuten Rechenzeit auf ei
nem Grorechner. Fortschrittlicher war dagegen ein von Dragon Systems entwickeltes
System: Dieses lie sich auf einem tragbaren PC verwenden.
1991 stellte IBM erstmals auf der CeBIT ein Spracherkennungssystem vor, das 20.0
00 bis 30.000 deutsche Wrter erkennen konnte. Die Prsentation des TANGORA 4 genann
ten Systems musste jedoch in einem speziell abgeschirmten Raum stattfinden, da d
er Lrm der Messe das System sonst gestrt htte.
Ende 1993 stellte IBM das erste fr den Massenmarkt entwickelte Spracherkennungssy
stem vor: Das IBM Personal Dictation System genannte System lief auf normalen PC
s und kostete unter 1000 Dollar. Als es unter dem Namen IBM VoiceType Diktiersys
tem auf der CeBIT 1994 prsentiert wurde, stie es auf hohes Interesse seitens der B
esucher und der Fachpresse.
1997 erschienen fr den PC-Endbenutzer sowohl die Software IBM ViaVoice (Nachfolge
r von IBM VoiceType) als auch die Version 1.0 der Software Dragon NaturallySpeak
ing. 2004 gab IBM Teile seiner Spracherkennungsanwendungen als Open Source frei
und sorgte damit fr Aufsehen. Branchenkenner vermuteten als Grund taktische Manahm
en gegen die Firma Microsoft, die ebenfalls in diesem Bereich ttig ist und seit 2
007 mit Erscheinen von ihrem PC-Betriebssystem Windows Vista als integralen Best
andteil erstmals Spracherkennungsfunktionen fr die Steuerung wie auch fr das Dikta
t anbot, die bis heute in Windows 8.1 weiterentwickelt wurden.
Whrend die Entwicklung von IBM ViaVoice eingestellt wurde, entwickelte sich Drago
n NaturallySpeaking zur gegenwrtig meistverbreiteten sprecherabhngigen Drittanbiet
er-Spracherkennungssoftware fr Windows-PCs und wird von Nuance Communications sei
t 2005 hergestellt und vertrieben.
Nuance hat 2008 mit dem Erwerb der Philips Speech Recognition Systems, Wien, auc
h die Rechte an dem Software Development Kit (SDK) SpeechMagic erlangt, welches
insbesondere im Gesundheitsbereich Verbreitung gefunden hat. Fr iMac-Personal Com
puter von Apple wurde von dem Unternehmen MacSpeech seit 2006 eine Drittanbieter
-Spracherkennungssoftware unter dem Namen iListen vertrieben, die auf Philips-Ko
mponenten basierte. 2008 wurde diese durch MacSpeech Dictate unter Verwendung de
r Kernkomponenten von Dragon NaturallySpeaking abgelst und nach dem Erwerb von Ma
cSpeech durch Nuance Communications 2010 in Dragon Dictate (Version 2.0 - seit 2
012 wird die Version 3.0 vertrieben) umbenannt.
2007 wurde die Firma Siri Inc. gegrndet und im April 2010 von Apple gekauft.
ktober 2011 stellte Apple die Spracherkennungssoftware Siri fr das iPhone 4s
die der Erkennung und Verarbeitung von natrlich gesprochener Sprache (unter
ung von Apple Servern) dient und so Funktionen eines persnlichen Assistenten
en soll.

Im O
vor,
Nutz
erfll