用户一边朗读文字稿 texttxt 文件一边录音得到 audiomp3 文件文字稿一行就是一句话如何通过 python 第三方库不用在线语音识别服务获得文字稿每行文字在录音中的起始时间起始时间逐行 放在 timetxt中最后生成 subsrt 字幕文件
这是一个比较复杂的任务,需要用到音频处理和语音识别的相关知识。以下是一些大致的步骤:
-
首先需要使用 Python 第三方库 pydub 将音频文件导入程序中,然后将其转换成可操作的音频数据。
-
接着需要使用 Python 第三方库 SpeechRecognition 进行语音识别,将录音中的语音转换成文字。
-
然后需要将文字稿中的每行文字与录音中的每个时间点对应起来,得到每行文字在录音中的起始时间。
-
最后将每行文字的起始时间写入 time.txt 文件中,并生成 sub.srt 字幕文件。
这个任务比较复杂,需要有一定的音频处理和语音识别的基础知识。如果您对这些知识还不太了解,建议先学习相关的知识再尝试完成这个任务。
原文地址: http://www.cveoy.top/t/topic/GCi 著作权归作者所有。请勿转载和采集!