Wie sinnvoll ist die Trainingsphase in der Spracherkennungssoftware

Es gibt Spracherkennungssoftware mit und ohne Trainingsphase. Spracherkennungssoftware ohne Trainingsphase hat einen beschränkten Wortschatz und ist deshalb nur für einfache Aufgaben gedacht, wie zum Beispiel der Steuerung eines Gerätes mittels Sprachbefehlen oder einfachen privaten Schreibarbeiten.  

Bei der Spracherkennungssoftware mit Trainingsphase kann man einen schier unendlichen Wortschatz erstellen, abhängig von der Hardware (Arbeitsspeicher, Festplattenkapazität, etc.)  Man kann somit sehr komplexe Aufgaben erledigen, wie Briefe aller Art, Diplomarbeiten, Juristische Die anspruchsvolleren Aufgaben erfordern eine maximale Trefferquote, und es erleichtert die Arbeit ungemein, wenn man den Text flüssig diktieren kann. Dies wird in der Trainingsphase erarbeitet.  

Zunächst wird also die Software an die eigene Sprechweise angepasst. Dazu gehört der eigene Dialekt, das Sprachtempo, und man muss auch beachten, dass aufgrund der allgemeinen Sprachgewohnheiten bei zahlreichen Wörtern ganze Silben verschluckt werden. Wir verstehen die Sprache trotzdem, der Software muß man das beibringen. Für bestimmte Aufgaben benötigt man auch Fachwörter, die man in den Wortschatz hinzufügen möchte.  

Verzichtet man also auf die Trainingsphase, so kann man den Text nicht in einem natürlichen Sprachfluss diktieren, sondern man muss ungewohnt deutlich sprechen , was das Arbeiten unnötig erschwert(man denke an die Sprachcomputer von verschiedenen Hotlines, die bestimmt jeden von uns schon einmal zur Weißglut gebracht haben.  

Um also den größtmöglichen Nutzen aus der Spracherkennungssoftware zu ziehen, geht man bei der Trainingsphase wie folgt, vor: Zunächst arbeitet man den vom Programm vorgeschlagenen Standardtestphasenlauf ab. Hier wird die Aussprache in Bezug auf Konsonanten, Vokale, Lautstärke Schnelligkeit usw. mit den im Programm vorgegebenen Werten verglichen und auf die eigene Aussprache abgeglichen. Man sollte darauf achten, dass man nicht anders als sonst spricht, damit bei dem Diktat der natürliche Sprachfluss erhalten bleibt.  

Später kommen die fortgeschrittenen Funktionen, so kann man zum Beispiel Fachwörter, ganze Sätze und Redewendungen, die man immer wieder einmal braucht mit eingeben. Je nach Umfang des Wortschatzes muss man die nötige Hardware zur Verfügung stellen. Man benötigt einen schnellen Prozessor, sowie einen ausreichenden Arbeitsspeicher und die Festplattenkapazität, sonst verlangsamt sich das Programm mit zunehmendem Sprachschatz.  

Vor dem Kauf eines Mikrofons sollte man sich folgende Punkte überlegen: Es sollte den Geräuschpegel gut filtern können. Man sollte beweglich sein, wie man das zum Beispiel mit einem Headset-Mikrofon verwirklichen könnte. Mit der richtigen Hardware kann man sich die Arbeit enorm erleichtern.  

Die Arbeit mit der Trainingsphase mag zwar zeitaufwendig und mühsam erscheinen, aber der Nutzen und die Zeitersparnis hinterher ist enorm. Denn man kann seine Arbeiten in Ruhe diktieren, und wird mit nahezu fehlerfreien Texten belohnt.