Python3 代码分析:视频信息提取及 Excel 导出
该代码使用 Python3 语言编写,并利用 mediainfo 工具提取视频文件的详细信息。具体功能如下:
- 支持的视频格式: 代码定义了一个
supported_formats列表,包含了支持提取信息的视频格式。 - 获取文件信息: 代码使用
os.path.basename获取文件名,使用os.path.getsize获取文件大小,使用mediainfo命令获取视频和音频信息。 - 处理多音轨: 代码使用了循环遍历的方式,将多音轨的码率、采样率和语言信息合并在一起,并以 ' / ' 分隔。
- 计算压缩比率: 代码根据视频时长和文件大小计算了压缩比率,并保留两位小数。
- 格式化输出: 代码对时间格式进行了处理,并使用
convert_size函数将文件大小转换为更易读的格式。 - 错误处理: 代码使用了
try...except语句,捕获了文件处理过程中的异常,并将错误信息打印到控制台和err.txt文件中。 - 导出 Excel: 代码使用
openpyxl库将提取到的信息写入到 Excel 表格中,并设置了表格样式,包括表头颜色、字体加粗、单元格对齐方式等。
代码中使用了 subprocess 模块执行 mediainfo 命令,使用了 re 模块进行正则表达式匹配,使用了 math 模块进行数学运算。代码的整体结构清晰,逻辑易懂,可以作为一个示例代码,用于学习 Python3 编程和视频信息处理的相关知识。
代码示例:
import os
import re
import subprocess
import openpyxl
import math
from openpyxl.styles import Font, PatternFill, Alignment
# 视频格式
supported_formats = [
'.mp4',
'.avi',
'.mkv',
'.wmv',
'.mov',
'.flv',
'.m2ts',
'.ts',
'.rm',
'.rmvb',
'.vob',
'.3gp',
'.webm',
'.hdmov',
'.mp4v',
'.mpv4',
'.divx',
'.xvid',
'.f4v',
'.mpeg',
'.asf',
'.asx',
'.m2t',
]
# 输出Excel路径
excel_folder = '.'
# 输出Excel文件名
excel_file = 'video_info.xlsx'
# 正则表达式匹配码率数据中的空格
pattern = re.compile(r'(\d+)\s+(\d+)')
# 创建Excel文件
wb = openpyxl.Workbook()
ws = wb.active
ws.title = 'Video Info'
# 锁定表头
ws.freeze_panes = 'A2'
# 设置表头样式
header_font = Font(bold=True, color='800080') # 紫色
header_fill = PatternFill('solid', fgColor='C5E0B4')
header_alignment = Alignment(horizontal='center', vertical='center')
headers = [
'文件名',
'文件路径',
'格式',
'大小',
'时长',
'分辨率',
'码率',
'帧率',
'音频码率',
'音频采样率',
'音频语言',
'压缩比率',
'文件总数',
]
for col, header in enumerate(headers, start=1):
cell = ws.cell(row=1, column=col, value=header)
cell.font = header_font
cell.fill = header_fill
cell.alignment = header_alignment
# 处理失败文件个数
failed_count = 0
# 总计处理文件数
total_count = 0
# 遍历所有视频文件
success_count = 0
row = 2 # 从第二行开始写入数据
def process_video(video_file):
global success_count, row, failed_count
try:
# 获取文件名
file_name = os.path.basename(video_file)
# 获取文件大小
size_str = convert_size(os.path.getsize(video_file))
# 使用mediainfo获取视频信息 / 音频信息
with subprocess.Popen(
[
'mediainfo',
'--Inform=Video;%Format%|%Width%x%Height%|%BitRate/String%|%FrameRate%|%Duration/String3%',
video_file
], stdout=subprocess.PIPE) as video_proc,
subprocess.Popen(
[
'mediainfo',
'--Inform=Audio;%BitRate/String%|%SamplingRate/String%|%Language/String%',
video_file
],
stdout=subprocess.PIPE) as audio_proc:
video_output = video_proc.communicate()[0].decode().strip()
audio_output = audio_proc.communicate()[0].decode().strip()
# 解析输出结果
video_info = video_output.split('|')
audio_info = audio_output.split('|')
# 处理多音轨情况
audio_bitrate, audio_sampling_rate, audio_lang = zip(*[(audio_info[i*3],
audio_info[i*3+1], audio_info[i*3+2]) for i in range(len(audio_info)//3)])
# 时长取整
duration = video_info[4].split('.')[0]
h, m, s = duration.split(':')
duration = f'{h}:{m}:{str(s).zfill(2)}'
# 以分钟计算的时长
duration_minutes = int(h) * 60 + int(m) + math.ceil(float(s)) / 60
# 计算压缩比率
ratio = round(duration_minutes / os.path.getsize(video_file) * 1000000000, 2)
# 使用正则表达式替换码率数据中第1、2数字之间的空格
bitrate = re.sub(pattern, r'\1\2', video_info[2])
# 写入Excel文件
write_cell(ws, row, 1, file_name)
write_cell(ws, row, 2, os.path.dirname(video_file)) # 写入文件路径
write_cell(ws, row, 3, video_info[0])
write_cell(ws, row, 4, size_str)
write_cell(ws, row, 5, duration)
write_cell(ws, row, 6, video_info[1])
write_cell(ws, row, 7, bitrate)
write_cell(ws, row, 8, video_info[3])
write_cell(ws, row, 9, ' / '.join(audio_bitrate))
write_cell(ws, row, 10, ' / '.join(audio_sampling_rate))
write_cell(ws, row, 11, ' / '.join(audio_lang))
write_cell(ws, row, 12, ratio)
write_cell(ws, 2, 13, total_count) # 写入文件总数
# 打印进度
success_count += 1
row += 1
except Exception as e:
# 处理失败, 跳过并打印文件
failed_count += 1
print(f'处理文件 {video_file} 时失败:{e}')
# 写入失败到err.txt
with open('err.txt', 'a') as f:
f.write(f'{video_file}\n')
return False
return True
def process_folder(video_folder):
global total_count
# 获取视频文件递归
video_files = []
for root, dirs, files in os.walk(video_folder):
for file in files:
if os.path.splitext(file)[1] in supported_formats:
video_files.append(os.path.join(root, file))
total_count = len(video_files)
if total_count == 0:
print('无视频文件或路径为空')
else:
for i, video_file in enumerate(video_files, start=1):
if process_video(video_file):
print(f'已处理 {success_count}/{total_count} 共计', end='\r')
else:
print(f'处理文件 {i}/{total_count} 时失败', end='\r')
print(f'已处理 {success_count}/{total_count} 共计')
def convert_size(size):
# 转换单位
units = ['B', 'KiB', 'MiB', 'GiB']
i = 0
while size >= 1024 and i < len(units)-1:
size /= 1024
i += 1
return f'{size:.2f} {units[i]}'
def write_cell(ws, row, col, value):
# 写入Excel
cell = ws.cell(row=row, column=col, value=value)
if col == 13:
cell.font = Font(bold=True, color='FF0000')
if col in [10, 11, 13]:
cell.alignment = Alignment(horizontal='left')
else:
cell.alignment = Alignment(horizontal='center')
if col not in [3, 8, 9, 10, 11, 12, 13]:
ws.column_dimensions[cell.column_letter].width = 11
# 文件路径
path = input('请输入文件路径:')
if os.path.isfile(path):
# 1个文件 total_count += 1
total_count = 1
process_video(path)
elif os.path.isdir(path):
process_folder(path)
if total_count > 0:
# 保存Excel文件
os.makedirs(excel_folder, exist_ok=True)
excel_file_path = os.path.join(excel_folder, excel_file)
wb.save(excel_file_path)
# 打印处理失败文件个数和总计处理文件数
print(
f'成功处理 {success_count} 个文件, 失败 {failed_count} 个文件, 视频信息已保存到 {excel_file_path}'
)
该代码没有缩进错误。
代码特点:
- 代码使用了
mediainfo工具,它可以获取视频文件的详细信息。 - 代码支持处理多音轨视频文件。
- 代码计算了视频文件的压缩比率,方便用户了解视频的压缩程度。
- 代码对输出格式进行了优化,使结果更易于阅读。
- 代码提供了错误处理机制,可以有效地处理文件处理过程中出现的异常。
- 代码使用了
openpyxl库,可以方便地将提取到的信息写入到 Excel 表格中。
使用方法:
- 确保已安装
mediainfo和openpyxl库。 - 将代码保存为
.py文件。 - 运行代码,并输入待处理的视频文件路径或文件夹路径。
- 代码将自动提取视频信息,并将其写入到
video_info.xlsx文件中。
注意事项:
- 代码中使用了
mediainfo工具,需要确保系统中已安装该工具。 - 代码使用了
openpyxl库,需要确保系统中已安装该库。 - 代码可能会因为网络原因或文件损坏导致处理失败,请参考错误信息排查问题。
代码示例:
# 示例代码:
# 运行代码,并输入待处理的视频文件路径或文件夹路径。
# 代码将自动提取视频信息,并将其写入到 video_info.xlsx 文件中。
其他:
该代码可以作为基础,根据用户的需求进行修改和扩展。例如,可以增加对更多视频格式的支持,可以增加对更多视频信息字段的提取,可以将结果输出到其他格式的文件中。
希望本分析对您有所帮助!
附:
mediainfo工具下载地址:https://mediaarea.net/en/MediaInfo/Downloadsopenpyxl库安装方法:pip install openpyxl
如果您还有其他问题,请随时提出。
原文地址: https://www.cveoy.top/t/topic/mHcA 著作权归作者所有。请勿转载和采集!