Kategorien
Elektronische Kultur

Die Sprache setzt sich als Schnittstelle zwischen Mensch und Computer durch

Deutsches Allgemeines Sonntagsblatt v. 20.03.1998

Der gehorsame Computer

Die Sprache setzt sich als Schnittstelle zwischen Mensch und Computer durch Es gilt als deutliches Zeichen der Überarbeitung, wenn ein Mensch mit seinem Computer spricht. Meist muß die Maschine in solchen Fällen unflätige Ausdrücke oder gar Wutausbrüche über sich ergehen lassen. „Mist Kiste, was willst Du denn jetzt schon wieder?“ ist eine der häufigen Fragen, die ein entnervter Angestellter dem Bildschirm seines PCs entgegenschleudert. Schon in naher Zukunft wird die Maschine ihm die Antwort nicht mehr schuldig bleiben. Ob die Fernbedienung der Waschmaschine und des Autoradios oder das zügige diktieren von Texten: Die Spracherkennung durch den Computer steht vor dem Durchbruch.

Was die menschliche Sprache leistet wird erst deutlich, wenn die sonst allmächtigen Computer mit den Aufgaben der Kommunikation betreut werden sollen. Über drei Jahrzehnte versuchten Entwickler von Software der Maschine das Geheimnis der Sprache einzubleuen – mit nur mäßigem Erfolg. Dies liegt in erster Linie an der Komplexität unseres Sprachverständnis, denn hören wir einen Satz von unserem Gegenüber, verrichten wir gleich mehrere Aufgaben: Aus den uns ständig umgebenen Geräuschen und Tönen filtern wir den wichtigen Teil der Information heraus, zugleich erkennen wir die zusammengehörende Kette von Wörtern und verstehen den Sinn einer Aussage, ihre Bedeutung. Und es ist uns fast gleichgültig, ob ein frimsischer Tenor oder bayrischer Sopran zu uns spricht.

Dem künstliche Spracherkenner steht ein weniger leistungsfähiges Instrumenarium zur Verfügung. Die Software vergleicht die durch ein Mikrofon aufgenommenen Laute mit den Wörter in ihrem Lexikon. Ein Wort, welches nicht gefunden wird, erkennt sie nicht. Die neue Generation der Diktierprogramme verfügt aus diesem Grunde über einen Wortstamm von mehreren zehntausend Begriffen. Dabei ist die Software inzwischen für den Endverbraucher erschwinglich und nach einiger Einarbeitungszeit leicht zu bedienen. Das Prinzip klingt simpel: Der Benutzer spricht über ein Kopfmikrofon -neudeutsch Headset- mit dem Computer, dieser formt die Laute in elektronische Signale um und läßt sie als Buchstaben, Wörter und Sätze auf dem Monitor erscheinen. Dabei erlauben es die besseren Diktiersysteme sogar mit normaler Geschwindigkeit in den PC zu sprechen. Jedoch kann sich ein neuer Benutzer nicht einfach an den Rechner setzen und drauflos sprechen, denn das System muß sich an neue Anwender erst einmal gewöhnen. Eine optimale Erkennungsrate des Gesprochenen erreicht eine Diktiersoftware erst nach mehreren Stunden Anwendung.

 

„Computer: Gehorche!“

 

Die Diktiersysteme zeigen auch den Weg in die Bedienung anderer Geräte auf. Mit den ausgefeilten Varianten ist es durchaus möglich, den Computer zum Drucken eines Textes oder zum Telefonanruf beim Geschäftspartner zu bewegen. Aber auch abseits des heimischen PCs setzt sich die Sprache als Schnittstelle zwischen Mensch und Maschine durch. Der Autocomputer der Zukunft wird ebenfalls über die Laute unseres Kehlkopfs zu steuern sein. Ohne die Hände vom Lenkrad nehmen zu müssen ist es dem Fahrer dann möglich, neben dem Autoradio auch das Autotelefon zu bedienen. Über eine Sprachausgabe hält der Mini-PC den Chauffeur mit aktuellen Staumeldungen und Hinweisen auf Umleitungen auf dem laufenden. Eine Navigationssoftware übernimmt dabei das lästige blättern im Straßenatlas. Der Softwaregigant Microsoft hat für den späten Sommer diesen Jahres einen solchen Auto-PC für den US-amerikanischen Markt angekündigt, der unter 1000 Dollar kosten soll. Microsoft war es auch, der jüngst 45 Millionen Dollar in die belgischen Experten für Sprachsoftware Lernout&Hauspie investierte. Bill Gates scheint zuversichtlich, daß der Spracherkennung die Zukunft gehört.

Als plastisches Vorbild gilt das Raumschiff Enterprise, in welchem die Besatzung um Kapitän Kirk auf keine grafische Ausgabe mehr angewiesen ist, um mit dem Computer zu kommunizieren. Das wühlen in umfangreichen Datenbanken über Planeten geschieht über Sprachein- und Sprachausgabe. Mensch und Computer unterhalten sich im Plauderton miteinander. Für manche Sekretärin auf dem Planten Erde wäre es im Jahre 1998 schon eine enorme Erleichterung, wenn ihr PC auf die Ansage „Such mir mal alle Brief an die Firma Meier heraus“, blitzschnell die betreffende Korrespondenz auf dem Bildschirm präsentieren würde.

Weiche Eier durch sprachgestützte Computer sind ebenfalls keine Fiktion mehr. Die Firma „Home Automated Living“ und bieten mit HAL 2000 ein System an, welches mehr oder weniger wichtige Funktionen im Haus übernimmt. Der elektronische Butler schaltet auf Befehl Lampen ein und aus, entriegelt die Türen und mißt die Temperatur im Raum. Damit auch bald im deutschen Bungalow das Ambiente englischer Herrensitze herrscht, wird HAL 2000 ab Mitte des Jahres auf dem deutschen Markt erhältlich sein.

„Beam me up, Scotty“

Zur Zeit ist man von den rosigen Zeiten einer reinen Sprachsteuerung von Apparaten jeder Art aber weit entfernt. Wer einmal in der Warteschleife eines Software-Supports verweilte, wird dies nicht so schnell vergessen. Die dort laufende Systeme können nur wenige hundert Wörter unterscheiden und fordern langsame und deutliche Aussprache. Auch die beispielsweise von der Postbank angebotene Abfrage des Kontostands übers Telefon soll schon manchen Benutzer zur Verzweiflung getrieben haben, weil das System die Geheimzahl zum wiederholten mal nicht verstanden hatte. Die ältere Generation in der Bevölkerung staunt angesichts des technischen Fortschritts ohnehin oft Bauklötze. Aber nicht nur für sie ist das Bedienen eines Fahrkartenautomaten oder Videorecorders ein nerviges Abenteuer. Die Handhabung mittels Sprache könnte hier helfen, die Errungenschaften der Moderne besser in den Alltag zu integrieren.

Das Medium Sprache wird sich am Computer erst dann vollständig durchsetzen, wenn der Anwender das gesamte System Mithilfe seiner Anweisungen steuern kann. Und dazu müssen Sprachein- wie Sprachausgabe reibungslos funktionieren. Die neuen Diktierprogramme trumpfen zwar mit einer hohen Quote der Worterkennung auf, noch immer versteht die Software aber im Durchschnitt jedes zwanzigste Wort nicht korrekt. Nicht unschuldig an der Fehlerrate sind die Eigenheiten der deutschen Sprache, die sich gerne zusammengesetzter Wörtern bedient. Fachbegriffe und Fremdwörter machen den Programmen das Leben ebenfalls schwer. Für Juristen, Rechtsanwälte, technische Gutachter und Ärzte bieten die Hersteller deswegen zusätzliche Wörterbücher an, die den Wortschatz der Software erweitern. Die relevanten auf dem deutschen Markt erhältlichen PC-Programme gehen auf Entwicklungen von IBM und Dragon Systems zurück. Damit der Computer nicht versucht, jedes Räuspern, Husten oder schweres Atmen umzusetzen, kann man ihm antrainieren, solche Laute zu ignorieren. Das gilt auch für Papiergeraschel und im Hintergrund klingelnde Telefone. Bei aller Einfachheit der Bedienung: Alle auf dem Markt erhältliche Diktierprogramme verlangen einen erheblichen Zeitaufwand für die Anpassung an den Benutzer. Je mehr sich der Anwender hierbei Zeit läßt, desto besser erkennt ihn sein elektronischer Sekretär später. Dann ist die Leistung der Programme aber so gut, daß sich der Einsatz gerade für Vielschreiber und zum Diktieren langer Texte lohnt.

Wie bei anderen technischen Entwicklungen birgt auch die Spracherkennung positive wie negative Implikationen. Es ist nicht einzusehen, warum sich die Zusammenarbeit mit dem allgegenwärtigen Computer auf Maus und Tastatur beschränken soll. Die taktilen Fähigkeiten des Menschen können hier durchaus durch seine kommunikativen ergänzt werden. Im Bereich der Sprachinterpretation ergeben sich faszinierende Möglichkeiten – gerade für Blinde und Behinderte, die keine Tastatur benutzen können. Papierdokumente können schon seit längerem vom Computer eingelesen (gescannt), per Mustererkennung in Buchstaben übersetzt und anschließend vorgelesen werden. Nun steht der umgekehrte Weg offen, indem der Behinderte in ein Mikrofon spricht und der Text als Dokument verfügbar ist. Zum anderen wird auch die Unterhaltungsindustrie den neuen Markt entdecken. Denkbar sind nun Puppen, die variabel auf das reagieren, was ein Kind zu ihnen sagt. Wie immer man die Beispiele auch bewertet, sie zeigen deutlich, daß Kollege Computer weiterhin Einzug in alle Lebensbereiche hält.

Von Jörg Auf dem Hövel

Jörg Auf dem Hövel (* 7. Dezember 1965) ist Politikwissenschaftler und arbeitet als freier Journalist u. a. für die Telepolis, den Spiegel und Der Freitag.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.