Python中用SpeechRecognition库和 vosk模型来识别语音

作者：System 时间：2024年08月16日分类：所有,python 字数：713

这篇文章距离上次修改已过716天，其中的内容可能已经有所变动。




import speech_recognition as sr
import vosk
 
# 初始化语音识别器
recognizer = sr.Recognizer()
 
# 打开麦克风开始录音
with sr.Microphone() as source:
    print("请开始说话...")
    audio = recognizer.listen(source)
 
# 将录音转换为Vosk可以处理的格式
with open('audio.wav', 'wb') as f:
    f.write(audio.get_wav_data())
 
# 加载模型
model = vosk.Model('vosk-model-small-en-us-0.15')
 
# 打开音频文件
with open('audio.wav', 'rb') as f:
    audio = f.read()
 
# 使用Vosk模型进行识别
rec = model.create_recognizer()
print(rec.recognize(audio))
 
# 识别结束后，可以选择删除音频文件
import os
os.remove('audio.wav')

这段代码展示了如何使用Python的SpeechRecognition库和Vosk模型来识别语音。首先，我们初始化了语音识别器，用麦克风录制了音频，然后将音频保存为一个文件。接着，我们加载了Vosk模型，并对音频文件进行了识别。最后，识别完成后，可选择删除音频文件以清理资源。

Python中用SpeechRecognition库和 vosk模型来识别语音

评论已关闭

推荐阅读