Text-zu-Sprache (TTS) und Spracherkennung (SR)

Viele unserer Programme verwenden TTS oder SR und eine allgemeine Schnittstelle namens SAPI. Momentan unterstützen wir nur SAPI 4.0, beabsichtigen aber für die Zukunft, auch SAPI 5.x zu unterstützen. Das bedeutet, dass Sie prüfen müssen, welche Maschine Ihr Prozess unterstützt.

Text-zu-Sprache (Sprachsynthese)

Das ist die Methode, bei der Sie einen getippten Text in gesprochene Worte konvertieren können, zur Verwendung in einer unserer Anwendungen als Ansage oder zum Speichern als MP3- oder WAV-Datei. Die Sprachoptionen, die Sie in der Windows XP Systemsteuerung sehen, sind nur für SAPI 5.x Maschinen, es sind standardmäßig keine SAPI 4.0 Stimmen installiert. Wenn Sie ein Drittstimmen-Set verwenden, gehen Sie bitte sicher, dass dieses SAPI 4.0 unterstützt.

Um zu überprüfen, ob überhaupt welche installiert sind, starten Sie einfach eine NCH Software Anwendung und wählen die Text-zu-Sprache Option. Diese wird die Namen der verfügbaren Stimmen auflisten.

Wenn Sie keine haben, gehen Sie bitte auf www.nch.com.au/speech/de/index.html. Dort finden Sie Downloads für die kostenlosen Microsoft Sprach-Engines.

Spracherkennung

Das ist der Prozess, bei dem eine gesprochene Nachricht (z.B. ein Diktat) in Text konvertiert wird, um einem Dokument oder einer Email hinzugefügt zu werden. Beachten Sie auch hier, dass wir nur Maschinen verwenden können, die SAPI 4.0 Schnittstellen unterstützen, aber viele Maschinen (inkl. Dragon Naturally Speaking und IBM Via Voice) unterstützen beides, SAPI 4.0 und 5.x.

Für eine zuverlässige Spracherkennung müssen Sie Ihre Spracherkennungs-Engine intensiv trainieren. Nähere Informationen dazu finden Sie in dessen Dokumentation.

Andernfalls müssen Sie die NCH Anwendung so konfigurieren, dass Sie die Engine und den Nutzer wählen können. Der Nutzer ist in dem Fall die Person, die die original Audio-Datei erstellt hat, nicht die Person, die die Engine verwendet. Das ist besonders wichtig für Express Scribe, bei dem Sie Diktate von unterschiedlichen Quellen erhalten.