Python中用SpeechRecognition库和 vosk模型来识别语音
import speech_recognition as sr
import vosk
# 初始化语音识别器
recognizer = sr.Recognizer()
# 打开麦克风开始录音
with sr.Microphone() as source:
print("请开始说话...")
audio = recognizer.listen(source)
# 将录音转换为Vosk可以处理的格式
with open('audio.wav', 'wb') as f:
f.write(audio.get_wav_data())
# 加载模型
model = vosk.Model('vosk-model-small-en-us-0.15')
# 打开音频文件
with open('audio.wav', 'rb') as f:
audio = f.read()
# 使用Vosk模型进行识别
rec = model.create_recognizer()
print(rec.recognize(audio))
# 识别结束后,可以选择删除音频文件
import os
os.remove('audio.wav')
这段代码展示了如何使用Python的SpeechRecognition库和Vosk模型来识别语音。首先,我们初始化了语音识别器,用麦克风录制了音频,然后将音频保存为一个文件。接着,我们加载了Vosk模型,并对音频文件进行了识别。最后,识别完成后,可选择删除音频文件以清理资源。
评论已关闭