import os
import re
import subprocess
import openpyxl
import math
from openpyxl.styles import Font, PatternFill, Alignment

# 视频格式
supported_formats = [
    '.mp4',
    '.avi',
    '.mkv',
    '.wmv',
    '.mov',
    '.flv',
    '.m2ts',
    '.ts',
    '.rm',
    '.rmvb',
    '.vob',
    '.3gp',
    '.webm',
    '.hdmov',
    '.mp4v',
    '.mpv4',
    '.divx',
    '.xvid',
    '.f4v',
    '.mpeg',
    '.asf',
    '.asx',
    '.m2t',
]

# 输出 Excel 路径
excel_folder = '.'

# 输出 Excel 文件名
excel_file = 'video_info.xlsx'

# 正则表达式匹配码率数据中的空格
pattern = re.compile(r'(\d+)\s+(\d+)')

# 创建 Excel 文件
wb = openpyxl.Workbook()
ws = wb.active
ws.title = 'Video Info'

# 锁定表头
ws.freeze_panes = 'A2'

# 设置表头样式
header_font = Font(bold=True, color='800080')  # 紫色
header_fill = PatternFill('solid', fgColor='C5E0B4')
header_alignment = Alignment(horizontal='center', vertical='center')
headers = [
    '文件名',
    '文件路径',
    '格式',
    '大小',
    '时长',
    '分辨率',
    '码率',
    '帧率',
    '音频码率',
    '音频采样率',
    '音频语言',
    '压缩比率',
    '文件总数',
]
for col, header in enumerate(headers, start=1):
    cell = ws.cell(row=1, column=col, value=header)
    cell.font = header_font
    cell.fill = header_fill
    cell.alignment = header_alignment

# 处理失败文件个数
failed_count = 0

# 总计处理文件数
total_count = 0

# 遍历所有视频文件
success_count = 0
row = 2 # 从第二行开始写入数据

def process_video(video_file):
    global success_count, row, failed_count
    try:
        # 获取文件名
        file_name = os.path.basename(video_file)

        # 获取文件大小
        size_str = convert_size(os.path.getsize(video_file))

        # 使用mediainfo获取视频信息 / 音频信息
        with subprocess.Popen(
            [
			'mediainfo',
                '--Inform=Video;%Format%|%Width%x%Height%|%BitRate/String%|%FrameRate%|%Duration/String3%',
                video_file
            ], stdout=subprocess.PIPE) as video_proc, 
            subprocess.Popen(
			[
			'mediainfo',
                '--Inform=Audio;%BitRate/String%|%SamplingRate/String%|%Language/String%',
                video_file
            ],
            stdout=subprocess.PIPE) as audio_proc:
            video_output = video_proc.communicate()[0].decode().strip()
            audio_output = audio_proc.communicate()[0].decode().strip()

        # 解析输出结果
        video_info = video_output.split('|')
        audio_info = audio_output.split('|')

        # 处理多音轨情况
        audio_bitrate, audio_sampling_rate, audio_lang = zip(*[(audio_info[i*3], 
        audio_info[i*3+1], audio_info[i*3+2]) for i in range(len(audio_info)//3)])

        # 时长取整
        duration = video_info[4].split('.')[0]
        h, m, s = duration.split(':')
        duration = f'{h}:{m}:{str(s).zfill(2)}'

        # 以分钟计算的时长
        duration_minutes = int(h) * 60 + int(m) + math.ceil(float(s)) / 60

        # 计算压缩比率
        ratio = round(duration_minutes / os.path.getsize(video_file) * 1000000000, 2)

        # 使用正则表达式替换码率数据中第1、2数字之间的空格
        bitrate = re.sub(pattern, r'\1\2', video_info[2])

        # 写入 Excel 文件
        write_cell(ws, row, 1, file_name)
        write_cell(ws, row, 2, os.path.dirname(video_file))  # 写入文件路径
        write_cell(ws, row, 3, video_info[0])
        write_cell(ws, row, 4, size_str)
        write_cell(ws, row, 5, duration)
        write_cell(ws, row, 6, video_info[1])
        write_cell(ws, row, 7, bitrate)
        write_cell(ws, row, 8, video_info[3])
        write_cell(ws, row, 9, ' / '.join(audio_bitrate))
        write_cell(ws, row, 10, ' / '.join(audio_sampling_rate))
        write_cell(ws, row, 11, ' / '.join(audio_lang))
        write_cell(ws, row, 12, ratio)
        write_cell(ws, 2, 13, total_count) # 写入文件总数

        # 打印进度
        success_count += 1
        row += 1

    except Exception as e:
        # 处理失败, 跳过并打印文件
        failed_count += 1
        print(f'处理文件 {video_file} 时失败:{e}')
        # 写入失败到err.txt
        with open('err.txt', 'a') as f:
            f.write(f'{video_file}\n')
        return False

    return True

def process_folder(video_folder):
    global total_count
    # 获取视频文件递归
    video_files = []
    for root, dirs, files in os.walk(video_folder):
        for file in files:
            if os.path.splitext(file)[1] in supported_formats:
                video_files.append(os.path.join(root, file))
    total_count = len(video_files)
    if total_count == 0:
        print('无视频文件或路径为空')
    else:
        for i, video_file in enumerate(video_files, start=1):
            if process_video(video_file):
                print(f'已处理 {success_count}/{total_count} 共计', end='\r')
            else:
                print(f'处理文件 {i}/{total_count} 时失败', end='\r')
        print(f'已处理 {success_count}/{total_count} 共计')

def convert_size(size):
    # 转换单位
    units = ['B', 'KiB', 'MiB', 'GiB']
    i = 0
    while size >= 1024 and i < len(units)-1:
        size /= 1024
        i += 1
    return f'{size:.2f} {units[i]}'

def write_cell(ws, row, col, value):
    # 写入Excel
    cell = ws.cell(row=row, column=col, value=value)
    if col == 13:
        cell.font = Font(bold=True, color='FF0000')
    if col in [10, 11, 13]:
        cell.alignment = Alignment(horizontal='left')
    else:
        cell.alignment = Alignment(horizontal='center')
    if col not in [3, 8, 9, 10, 11, 12, 13]:
        ws.column_dimensions[cell.column_letter].width = 11

# 文件路径
path = input('请输入文件路径:')
if os.path.isfile(path):
    # 1个文件 total_count += 1
    total_count = 1 
    process_video(path)
elif os.path.isdir(path):
    process_folder(path) 

if total_count > 0:
    # 保存 Excel 文件
    os.makedirs(excel_folder, exist_ok=True)
    excel_file_path = os.path.join(excel_folder, excel_file)
    wb.save(excel_file_path)

    # 打印处理失败文件个数和总计处理文件数
    print(
        f'成功处理 {success_count} 个文件, 失败 {failed_count} 个文件, 视频信息已保存到 {excel_file_path}'
    )

该代码主要功能是使用 mediainfo 库提取视频文件的信息,并写入 Excel 表格。具体步骤如下:

  1. 导入库: 导入必要的库,包括 osresubprocessopenpyxlmath
  2. 定义支持的视频格式: 定义一个列表 supported_formats,包含支持提取信息的视频格式。
  3. 设置输出 Excel 文件路径和文件名: 定义变量 excel_folderexcel_file,分别指定输出 Excel 文件的路径和文件名。
  4. 创建 Excel 文件: 使用 openpyxl 库创建一个新的 Excel 文件,并命名工作表为 Video Info
  5. 设置表头样式: 设置表头字体、颜色、填充色和对齐方式。
  6. 遍历视频文件: 使用 os.walk 递归遍历指定的目录或文件,找到所有支持的视频文件。
  7. 提取视频信息: 使用 subprocess.Popen 执行 mediainfo 命令,提取每个视频文件的相关信息,包括格式、分辨率、码率、帧率、音频码率、音频采样率、音频语言等。
  8. 写入 Excel 表格: 将提取的视频信息写入相应的 Excel 单元格。
  9. 保存 Excel 文件: 使用 wb.save 将 Excel 文件保存到指定路径。

该代码还包含一些细节处理,比如:

  • 转换文件大小单位:使用 convert_size 函数将文件大小转换为更易读的格式。
  • 处理多音轨情况:使用 zip 函数处理多个音轨的信息。
  • 计算压缩比率:根据视频时长和文件大小计算压缩比率。
  • 进度打印:在处理视频文件时打印进度信息,让用户了解代码运行状态。
  • 错误处理:使用 try...except 代码块捕获异常,并在处理失败时打印错误信息并记录到 err.txt 文件中。

代码特点:

  • 代码结构清晰,注释详细,易于理解。
  • 使用了 mediainfo 库,可以获取视频文件的丰富信息。
  • 使用了 openpyxl 库,方便操作 Excel 表格。
  • 实现了进度打印和错误处理机制,提高代码健壮性。

代码适用场景:

  • 需要快速获取大量视频文件的信息。
  • 需要将视频文件信息整理到 Excel 表格中。
  • 需要进行视频文件分析和管理。

使用说明:

  1. 将代码保存为 .py 文件。
  2. 确保系统中已安装 mediainfoopenpyxl 库。
  3. 运行代码,输入需要处理的视频文件或目录路径。
  4. 代码将自动提取视频信息并写入 Excel 表格。

代码示例:

假设需要处理 videos 目录下的所有视频文件,则可以输入 videos 作为文件路径。代码将提取每个视频文件的信息,并写入名为 video_info.xlsx 的 Excel 文件中。

该代码简洁高效,能够帮助用户快速获取大量视频文件的信息,并整理到 Excel 表格中,方便后续的分析和管理。


原文地址: https://www.cveoy.top/t/topic/mHcB 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录