Steven5538

Python 語音辨識

Word count: 193Reading time: 1 min
2015/05/22 Share

最近因需求必須做語音辨識,這邊講一下怎麼用 Python 實作。
首先必須安裝套件。

1
sudo pip install SpeechRecognition

該套件利用 Google Speech Recognition API 去實現語音辨識的功能,所以網路功能是必須的。
將要辨識的檔案先存下來,然後試試以下代碼。
1
2
3
4
5
6
7
8
9
import speech_recognition as sr
r = sr.Recognizer()
with sr.WavFile("test.wav") as source:
audio = r.record(source)

try:
print("Transcription: " + r.recognize(audio))
except LookupError:
print("Could not understand audio")

必須要注意的是預設辨識語言是英文,假設你要辨識的是中文,請修改一下第二行為:

1
r = sr.Recognizer('zh_TW')

另外若覺得雜訊太多可以設定 thershold,在第三行前插入:

1
r.energy_threshold = 4000

4000 可以自行調整(官方說 4000 效果就很好了)。

CATALOG