Python mediainfo 多音轨音频语言信息处理 - 优化代码
Python mediainfo 多音轨音频语言信息处理 - 优化代码/n/n本文将介绍如何使用Python和mediainfo库处理多音轨视频的音频语言信息,优化代码使其能够将有多音轨信息的音频语言列打印为'audio_lang'+'双轨'。/n/npython/nimport os/nimport re/nimport subprocess/nimport openpyxl/nimport math/nfrom openpyxl.styles import Font, PatternFill, Alignment/n/n# 视频格式/nsupported_formats = [/n '.mp4',/n '.avi',/n '.mkv',/n '.wmv',/n '.mov',/n '.flv',/n '.m2ts',/n '.ts',/n '.rm',/n '.rmvb',/n '.vob',/n '.3gp',/n '.webm',/n '.hdmov',/n '.mp4v',/n '.mpv4',/n '.divx',/n '.xvid',/n '.f4v',/n '.mpeg',/n '.asf',/n '.asx',/n '.m2t',/n]/n/n# 视频文件夹/nvideo_folder = input('请输入文件夹路径:')/n/n# 输出Excel路径/nexcel_folder = '.'/n/n# 输出Excel文件名/nexcel_file = 'video_info.xlsx'/n/n# 正则表达式匹配码率数据中的空格/npattern = re.compile(r'(/d+)/s+(/d+)')/n/n# 创建Excel文件/nwb = openpyxl.Workbook()/nws = wb.active/nws.title = 'Video Info'/n/n# 获取视频文件列表(包括子目录)/nvideo_files = []/nfor root, dirs, files in os.walk(video_folder):/n for file in files:/n for format in supported_formats:/n if file.endswith(format):/n video_files.append(os.path.join(root, file))/n break/n/n# 锁定表头/nws.freeze_panes = 'A2'/n/n# 设置表头样式/nheader_font = Font(bold=True, color='800080') # 紫色/nheader_fill = PatternFill('solid', fgColor='C5E0B4')/nheader_alignment = Alignment(horizontal='center', vertical='center')/nheaders = [/n '文件名',/n '文件路径',/n '格式',/n '大小',/n '时长',/n '分辨率',/n '码率',/n '帧率',/n '音频码率1',/n '音频采样率1',/n '音频语言1',/n '音频码率2',/n '音频采样率2',/n '音频语言2',/n '压缩比率',/n]/nfor col, header in enumerate(headers, start=1):/n cell = ws.cell(row=1, column=col, value=header)/n cell.font = header_font/n cell.fill = header_fill/n cell.alignment = header_alignment/n/n# 处理失败文件个数/nfailed_count = 0/n/n# 遍历所有视频文件/nsuccess_count = 0/nrow = 2 # 从第二行开始写入数据/nfor video_file in video_files:/n try:/n # 获取文件名/n file_name = os.path.basename(video_file)/n/n # 获取文件大小并进行单位换算/n size = os.path.getsize(video_file)/n if size < 1024:/n size_str = f'{size} B'/n elif size < 1024 * 1024:/n size_str = f'{size / 1024:.2f} KiB'/n elif size < 1024 * 1024 * 1024:/n size_str = f'{size / 1024 / 1024:.2f} MiB'/n else:/n size_str = f'{size / 1024 / 1024 / 1024:.2f} GiB'/n/n # 使用mediainfo获取视频信息 / 音频信息/n video_result = subprocess.run(/n [/n 'mediainfo',/n '--Inform=Video;%Format%|%Width%x%Height%|%BitRate/String%|%FrameRate%|%Duration/String3%',/n video_file,/n ],/n stdout=subprocess.PIPE,/n )/n video_output = video_result.stdout.decode().strip()/n audio_result = subprocess.run(/n [/n 'mediainfo',/n '--Inform=Audio;%BitRate/String%|%SamplingRate/String%|%Language/String%',/n video_file,/n ],/n stdout=subprocess.PIPE,/n )/n audio_output = audio_result.stdout.decode().strip()/n/n # 解析输出结果/n video_info = video_output.split('|')/n audio_info = audio_output.split('|')/n/n # 处理多音轨情况/n audio_count = len(audio_info) // 3/n if audio_count > 1:/n headers = headers[:8] + ['音频码率'+str(i+1) for i in range(audio_count)] // /n + ['音频采样率'+str(i+1) for i in range(audio_count)] // /n + ['音频语言'+str(i+1) for i in range(audio_count)] + ['压缩比率']/n ws.delete_cols(9, 6)/n for col, header in enumerate(headers, start=1):/n cell = ws.cell(row=1, column=col, value=header)/n cell.font = header_font/n cell.fill = header_fill/n cell.alignment = header_alignment/n ws.cell(row=row, column=15, value=' / '.join(audio_bitrate))/n else:/n audio_bitrate = [audio_info[0]]/n audio_sampling_rate = [audio_info[1]]/n audio_lang = ['audio_lang'+str(i+1) for i in range(audio_count)]/n/n # 时长取整/n duration = video_info[4].split('.')[0]/n h, m, s = duration.split(':')/n duration = f'{h}:{m}:{str(s).zfill(2)}'/n/n # 以分钟计算的时长 2/n duration_minutes = int(h) * 60 + int(m) + math.ceil(float(s)) / 60/n/n # 计算压缩比率/n ratio = round(duration_minutes / size * 1000000000, 2)/n/n # 使用正则表达式替换码率数据中第一个数字和第二个数字之间的空格/n bitrate = re.sub(pattern, r'/1/2', video_info[2])/n/n # 写入Excel文件/n ws.cell(row=row, column=1, value=file_name)/n ws.cell(row=row, column=2, value=os.path.dirname(video_file)) # 写入文件夹路径/n ws.cell(row=row, column=3, value=video_info[0])/n ws.cell(row=row, column=4, value=size_str)/n ws.cell(row=row, column=5, value=duration)/n ws.cell(row=row, column=6, value=video_info[1])/n ws.cell(row=row, column=7, value=bitrate)/n ws.cell(row=row, column=8, value=video_info[3])/n for i in range(audio_count):/n ws.cell(row=row, column=9+i, value=audio_bitrate[i])/n ws.cell(row=row, column=9+audio_count+i, value=audio_sampling_rate[i])/n ws.cell(row=row, column=9+2*audio_count+i, value=audio_lang[i]+'双轨' if i==1 else audio_lang[i])/n/n # 打印进度/n print(f'已处理 {success_count+1}/{len(video_files)} 共计', end='/r')/n success_count += 1/n row += 1/n/n except Exception as e:/n # 处理失败,跳过并打印文件名和具体错误信息/n failed_count += 1/n print(f'处理文件 {file_name} 时失败:{e}')/n # 将失败的文件写入到err.txt/n with open('err.txt', 'a') as f:/n f.write(f'{file_name}/n')/n continue/n/n# 总计处理文件数/ntotal_count = len(video_files)/n/n# 调整L列左对齐/nl_col = ws['L']/nfor cell in l_col:/n cell.alignment = Alignment(horizontal='left') # 左对齐/n/n# 固定列宽/nfor col in ws.columns:/n col_letter = col[0].column_letter/n if col_letter not in ['']: # 不固定文件夹路径、格式、音频语言列的宽度/n ws.column_dimensions[col_letter].width = 11/n/n# 保存Excel文件/nif not os.path.exists(excel_folder):/n os.makedirs(excel_folder)/nexcel_file_path = os.path.join(excel_folder, excel_file)/nwb.save(excel_file_path)/n/n# 打印处理失败文件个数和总计处理文件数/nprint(/n f'已完成,处理成功 {success_count} 个文件,处理失败 {failed_count} 个文件,视频信息已保存到 {excel_file_path}'/n)/n/n/n代码优化说明:/n/n1. 将 audio_lang = [audio_info[2]] 修改为 audio_lang = ['audio_lang'+str(i+1) for i in range(audio_count)],这样就能根据音轨数量动态生成音频语言列的标题,例如 'audio_lang1'、'audio_lang2' 等。/n/n2. 将 ws.cell(row=row, column=9+i, value=audio_bitrate[i])/nws.cell(row=row, column=9+audio_count+i, value=audio_sampling_rate[i])/nws.cell(row=row, column=9+2*audio_count+i, value=audio_lang[i]) 修改为 ws.cell(row=row, column=9+i, value=audio_bitrate[i])/nws.cell(row=row, column=9+audio_count+i, value=audio_sampling_rate[i])/nws.cell(row=row, column=9+2*audio_count+i, value=audio_lang[i]+'双轨' if i==1 else audio_lang[i]),这样就能在有多音轨时,将第二个音频语言列的标题打印为 'audio_lang2双轨'。/n/n通过以上修改,代码就能更好地处理多音轨视频的音频语言信息,并将相关信息准确地写入 Excel 文件中。/n/n注意:/n/n- 该代码需要安装 mediainfo 库,可以使用 pip install mediainfo 命令安装。/n- 该代码假设视频文件都包含音频信息,如果没有音频信息,可能会出现错误。/n- 该代码默认输出 Excel 文件名为 'video_info.xlsx',可以根据需要修改。/n- 该代码默认输出 Excel 文件路径为当前目录,可以根据需要修改。/n/n希望本文能够帮助你使用 Python 和 mediainfo 库处理多音轨视频的音频语言信息。
原文地址: https://www.cveoy.top/t/topic/mFfS 著作权归作者所有。请勿转载和采集!