Python 视频音频转文字:简单易懂的代码示例
要实现将视频中的音频转换为文字,可以使用 Python 中的一些语音识别库。以下是一个使用 SpeechRecognition 库的示例代码:
import speech_recognition as sr
# 创建一个Recognizer对象
r = sr.Recognizer()
# 读取视频中的音频
audio_file = sr.AudioFile('video_audio.wav')
# 使用Recognizer对象进行语音识别
with audio_file as source:
audio = r.record(source)
# 将音频转换为文字
text = r.recognize_google(audio, language='en')
# 打印转换结果
print(text)
在上面的代码中,首先导入了 speech_recognition 库,并创建了一个 Recognizer 对象。然后,使用 AudioFile 函数加载视频中的音频文件。接下来,使用 Recognizer 对象的 record 方法将音频读取到内存中。最后,使用 recognize_google 方法将音频转换为文字,并将结果打印出来。
需要注意的是,在运行代码之前,需要确保已经安装了 SpeechRecognition 库,可以使用以下命令进行安装:
pip install SpeechRecognition
另外,需要将代码中的 'video_audio.wav' 替换为实际视频中的音频文件路径。
原文地址: https://www.cveoy.top/t/topic/qoFq 著作权归作者所有。请勿转载和采集!