Python 视频转文字：使用 SpeechRecognition 库

想要将视频中的音频转成文字？可以使用 Python 中的 SpeechRecognition 库来实现。

首先，需要安装 SpeechRecognition 库，可以使用以下命令来安装：

pip install SpeechRecognition

然后，导入 SpeechRecognition 库，并创建一个 Recognizer 对象来进行语音识别。使用 Recognizer 对象的'recognize_google()' 方法可以将音频转成文字。代码如下所示：

import speech_recognition as sr

def convert_audio_to_text(video_path):
    # 创建一个 Recognizer 对象
    r = sr.Recognizer()

    # 使用 AudioFile 函数打开视频文件
    with sr.AudioFile(video_path) as source:
        # 读取音频数据
        audio = r.record(source)
        
        try:
            # 将音频转成文字
            text = r.recognize_google(audio, language='en-US')
            return text
        except sr.UnknownValueError:
            print('无法识别音频内容')
        except sr.RequestError as e:
            print('无法连接到 Google API: {0}'.format(e))

# 调用函数并传入视频文件路径
video_path = 'path_to_video.mp4'
result = convert_audio_to_text(video_path)
if result:
    print(result)

请注意，这个方法使用的是 Google 的语音识别 API，需要联网才能使用。另外，语音识别的准确率可能会受到音频质量、语音清晰度等因素的影响。