Python3 代码分析:视频信息提取
import os
import re
import subprocess
import openpyxl
import math
from openpyxl.styles import Font, PatternFill, Alignment
# 视频格式
supported_formats = [
'.mp4',
'.avi',
'.mkv',
'.wmv',
'.mov',
'.flv',
'.m2ts',
'.ts',
'.rm',
'.rmvb',
'.vob',
'.3gp',
'.webm',
'.hdmov',
'.mp4v',
'.mpv4',
'.divx',
'.xvid',
'.f4v',
'.mpeg',
'.asf',
'.asx',
'.m2t',
]
# 输出 Excel 路径
excel_folder = '.'
# 输出 Excel 文件名
excel_file = 'video_info.xlsx'
# 正则表达式匹配码率数据中的空格
pattern = re.compile(r'(\d+)\s+(\d+)')
# 创建 Excel 文件
wb = openpyxl.Workbook()
ws = wb.active
ws.title = 'Video Info'
# 锁定表头
ws.freeze_panes = 'A2'
# 设置表头样式
header_font = Font(bold=True, color='800080') # 紫色
header_fill = PatternFill('solid', fgColor='C5E0B4')
header_alignment = Alignment(horizontal='center', vertical='center')
headers = [
'文件名',
'文件路径',
'格式',
'大小',
'时长',
'分辨率',
'码率',
'帧率',
'音频码率',
'音频采样率',
'音频语言',
'压缩比率',
'文件总数',
]
for col, header in enumerate(headers, start=1):
cell = ws.cell(row=1, column=col, value=header)
cell.font = header_font
cell.fill = header_fill
cell.alignment = header_alignment
# 处理失败文件个数
failed_count = 0
# 总计处理文件数
total_count = 0
# 遍历所有视频文件
success_count = 0
row = 2 # 从第二行开始写入数据
def process_video(video_file):
global success_count, row, failed_count
try:
# 获取文件名
file_name = os.path.basename(video_file)
# 获取文件大小
size_str = convert_size(os.path.getsize(video_file))
# 使用mediainfo获取视频信息 / 音频信息
with subprocess.Popen(
[
'mediainfo',
'--Inform=Video;%Format%|%Width%x%Height%|%BitRate/String%|%FrameRate%|%Duration/String3%',
video_file
], stdout=subprocess.PIPE) as video_proc,
subprocess.Popen(
[
'mediainfo',
'--Inform=Audio;%BitRate/String%|%SamplingRate/String%|%Language/String%',
video_file
],
stdout=subprocess.PIPE) as audio_proc:
video_output = video_proc.communicate()[0].decode().strip()
audio_output = audio_proc.communicate()[0].decode().strip()
# 解析输出结果
video_info = video_output.split('|')
audio_info = audio_output.split('|')
# 处理多音轨情况
audio_bitrate, audio_sampling_rate, audio_lang = zip(*[(audio_info[i*3],
audio_info[i*3+1], audio_info[i*3+2]) for i in range(len(audio_info)//3)])
# 时长取整
duration = video_info[4].split('.')[0]
h, m, s = duration.split(':')
duration = f'{h}:{m}:{str(s).zfill(2)}'
# 以分钟计算的时长
duration_minutes = int(h) * 60 + int(m) + math.ceil(float(s)) / 60
# 计算压缩比率
ratio = round(duration_minutes / os.path.getsize(video_file) * 1000000000, 2)
# 使用正则表达式替换码率数据中第1、2数字之间的空格
bitrate = re.sub(pattern, r'\1\2', video_info[2])
# 写入 Excel 文件
write_cell(ws, row, 1, file_name)
write_cell(ws, row, 2, os.path.dirname(video_file)) # 写入文件路径
write_cell(ws, row, 3, video_info[0])
write_cell(ws, row, 4, size_str)
write_cell(ws, row, 5, duration)
write_cell(ws, row, 6, video_info[1])
write_cell(ws, row, 7, bitrate)
write_cell(ws, row, 8, video_info[3])
write_cell(ws, row, 9, ' / '.join(audio_bitrate))
write_cell(ws, row, 10, ' / '.join(audio_sampling_rate))
write_cell(ws, row, 11, ' / '.join(audio_lang))
write_cell(ws, row, 12, ratio)
write_cell(ws, 2, 13, total_count) # 写入文件总数
# 打印进度
success_count += 1
row += 1
except Exception as e:
# 处理失败, 跳过并打印文件
failed_count += 1
print(f'处理文件 {video_file} 时失败:{e}')
# 写入失败到err.txt
with open('err.txt', 'a') as f:
f.write(f'{video_file}\n')
return False
return True
def process_folder(video_folder):
global total_count
# 获取视频文件递归
video_files = []
for root, dirs, files in os.walk(video_folder):
for file in files:
if os.path.splitext(file)[1] in supported_formats:
video_files.append(os.path.join(root, file))
total_count = len(video_files)
if total_count == 0:
print('无视频文件或路径为空')
else:
for i, video_file in enumerate(video_files, start=1):
if process_video(video_file):
print(f'已处理 {success_count}/{total_count} 共计', end='\r')
else:
print(f'处理文件 {i}/{total_count} 时失败', end='\r')
print(f'已处理 {success_count}/{total_count} 共计')
def convert_size(size):
# 转换单位
units = ['B', 'KiB', 'MiB', 'GiB']
i = 0
while size >= 1024 and i < len(units)-1:
size /= 1024
i += 1
return f'{size:.2f} {units[i]}'
def write_cell(ws, row, col, value):
# 写入Excel
cell = ws.cell(row=row, column=col, value=value)
if col == 13:
cell.font = Font(bold=True, color='FF0000')
if col in [10, 11, 13]:
cell.alignment = Alignment(horizontal='left')
else:
cell.alignment = Alignment(horizontal='center')
if col not in [3, 8, 9, 10, 11, 12, 13]:
ws.column_dimensions[cell.column_letter].width = 11
# 文件路径
path = input('请输入文件路径:')
if os.path.isfile(path):
# 1个文件 total_count += 1
total_count = 1
process_video(path)
elif os.path.isdir(path):
process_folder(path)
if total_count > 0:
# 保存 Excel 文件
os.makedirs(excel_folder, exist_ok=True)
excel_file_path = os.path.join(excel_folder, excel_file)
wb.save(excel_file_path)
# 打印处理失败文件个数和总计处理文件数
print(
f'成功处理 {success_count} 个文件, 失败 {failed_count} 个文件, 视频信息已保存到 {excel_file_path}'
)
该代码主要功能是使用 mediainfo 库提取视频文件的信息,并写入 Excel 表格。具体步骤如下:
- 导入库: 导入必要的库,包括
os、re、subprocess、openpyxl和math。 - 定义支持的视频格式: 定义一个列表
supported_formats,包含支持提取信息的视频格式。 - 设置输出 Excel 文件路径和文件名: 定义变量
excel_folder和excel_file,分别指定输出 Excel 文件的路径和文件名。 - 创建 Excel 文件: 使用
openpyxl库创建一个新的 Excel 文件,并命名工作表为Video Info。 - 设置表头样式: 设置表头字体、颜色、填充色和对齐方式。
- 遍历视频文件: 使用
os.walk递归遍历指定的目录或文件,找到所有支持的视频文件。 - 提取视频信息: 使用
subprocess.Popen执行mediainfo命令,提取每个视频文件的相关信息,包括格式、分辨率、码率、帧率、音频码率、音频采样率、音频语言等。 - 写入 Excel 表格: 将提取的视频信息写入相应的 Excel 单元格。
- 保存 Excel 文件: 使用
wb.save将 Excel 文件保存到指定路径。
该代码还包含一些细节处理,比如:
- 转换文件大小单位:使用
convert_size函数将文件大小转换为更易读的格式。 - 处理多音轨情况:使用
zip函数处理多个音轨的信息。 - 计算压缩比率:根据视频时长和文件大小计算压缩比率。
- 进度打印:在处理视频文件时打印进度信息,让用户了解代码运行状态。
- 错误处理:使用
try...except代码块捕获异常,并在处理失败时打印错误信息并记录到err.txt文件中。
代码特点:
- 代码结构清晰,注释详细,易于理解。
- 使用了
mediainfo库,可以获取视频文件的丰富信息。 - 使用了
openpyxl库,方便操作 Excel 表格。 - 实现了进度打印和错误处理机制,提高代码健壮性。
代码适用场景:
- 需要快速获取大量视频文件的信息。
- 需要将视频文件信息整理到 Excel 表格中。
- 需要进行视频文件分析和管理。
使用说明:
- 将代码保存为
.py文件。 - 确保系统中已安装
mediainfo和openpyxl库。 - 运行代码,输入需要处理的视频文件或目录路径。
- 代码将自动提取视频信息并写入 Excel 表格。
代码示例:
假设需要处理 videos 目录下的所有视频文件,则可以输入 videos 作为文件路径。代码将提取每个视频文件的信息,并写入名为 video_info.xlsx 的 Excel 文件中。
该代码简洁高效,能够帮助用户快速获取大量视频文件的信息,并整理到 Excel 表格中,方便后续的分析和管理。
原文地址: https://www.cveoy.top/t/topic/mHcB 著作权归作者所有。请勿转载和采集!