Conversione testo-voce (TTS) e riconoscimento vocale (SR)

Molte delle nostre applicazioni utilizzano TTS o SR e usano un'interfaccia generale chiamata SAPI.

Conversione testo-voce

Si tratta di un metodo in cui è possibile prendere alcuni tipi di testo e convertirli in parole parlate per l'uso nelle nostre applicazioni come prompt o solo per essere salvate come mp3 o file wav.

Per verificare se sono installati utilizzare l'applicazione NCH Swift Sound a propria scelta e selezionare l'opzione Text to Speech, Conversione testo-voce. Verranno elencati i nomi delle voci disponibili.

Nel caso non ce ne fossero, si prega di controllare www.nch.com.au/speech/index.html. Il sito comprende i download per i motori gratuiti Microsoft Speech.

Riconoscimento vocale

Si tratta di una procedura in cui il messaggio parlato (ad esempio un dettato) può essere convertito in testo da inserirsi in un documento o in un email.

Per l'affidabilità del riconoscimento è necessario allenare in modo intenso il proprio sistema per il riconoscimento vocale. Per maggiori dettagli si prega di fare riferimento alla documentazione.

Al contrario sarà necessario configurare l'applicazione NCH per selezionare sistema e utente. L'utente rappresenta la persona che ha creato il dettato/file audio originali, non la persona che utilizza la macchina. Questo è importante soprattutto per Express Scribe in cui si ricevono dettati da fonti diverse.

Software correlato