Python 视频转文字:使用 SpeechRecognition 库
想要将视频中的音频转成文字?可以使用 Python 中的 SpeechRecognition 库来实现。
首先,需要安装 SpeechRecognition 库,可以使用以下命令来安装:
pip install SpeechRecognition
然后,导入 SpeechRecognition 库,并创建一个 Recognizer 对象来进行语音识别。使用 Recognizer 对象的'recognize_google()' 方法可以将音频转成文字。代码如下所示:
import speech_recognition as sr
def convert_audio_to_text(video_path):
# 创建一个 Recognizer 对象
r = sr.Recognizer()
# 使用 AudioFile 函数打开视频文件
with sr.AudioFile(video_path) as source:
# 读取音频数据
audio = r.record(source)
try:
# 将音频转成文字
text = r.recognize_google(audio, language='en-US')
return text
except sr.UnknownValueError:
print('无法识别音频内容')
except sr.RequestError as e:
print('无法连接到 Google API: {0}'.format(e))
# 调用函数并传入视频文件路径
video_path = 'path_to_video.mp4'
result = convert_audio_to_text(video_path)
if result:
print(result)
请注意,这个方法使用的是 Google 的语音识别 API,需要联网才能使用。另外,语音识别的准确率可能会受到音频质量、语音清晰度等因素的影响。
原文地址: https://www.cveoy.top/t/topic/qoFv 著作权归作者所有。请勿转载和采集!