문자 음성 변환(TTS)과 음성 인식(SR)

소프트웨어의 대부분은 음성 합성 (TTS)과 음성 인식(SR)이 사용되고 있으며, SAPI라는 일반적인 인터페이스를 사용하고 있습니다.

문자 음성 변환

유형 입력된 문자를 음성으로 읽어주는 기능으로, 응용 프로그램의 프롬프트로 사용하거나 mp3 또는 wav등의 오디오 파일로 저장하는 등에 사용됩니다.

기능이 탑재되어 있는지 확인하려면 사용자의 선택으로 NCH Swift 사운드 응용프로그램을 사용하여 "문자를 음성으로 변환" 옵션을 선택합니다. 기능이 탑재되어 있는 경우는 사용가능한 음성의 이름 목록이 표시됩니다.

목록이 나타나지 않는 경우, www.nch.com.au/speech/ko/index.html를 참조하십시오. Microsoft사의 무료 음성 엔진등을 다운로드하실 수 있습니다.

음성 인식

이것은 이야기 소리 (예를 들어서 받아쓰기)를 문자로 바뀌는 과정으로 문서 파일이나 이메일로 보낼수 있습니다.

더 정확한 결과를 창출하기 위해서는 음성 인식 엔진을 훈련해야 합니다. 더 자세한 설명은 음성 인식 엔진 설명서를 참조하십시오.

여러 화자의 음성을 전사하는 경우에 NCH 응용 프로그램의 옵션 화면에서 음성 인식 엔진과 사용자의 선택을 바로 해야 합니다. 여기서 말하는 사용자는 기기의 사용자가 아닌 원본의 받아쓰기/ 오디오 파일로 녹음된 목소리의 소유자입니다. Express Scribe 구술을 음성기호로 표기하는 프로그램을 사용하여 다양한 화자의 소스로 전사할 경우 화자 정보를 입력하여 보다 정확한 초안 문서를 만들 수 있습니다.

관련 소프트웨어