Python 批量视频信息提取工具:支持单个视频和文件夹处理

本工具使用 Python 语言编写,可以提取视频文件的信息,例如格式、大小、时长、分辨率、码率等。该工具支持单个视频文件和整个文件夹的批量处理,并将结果保存到 Excel 文件中。

代码如下:

import os
import re
import subprocess
import openpyxl
import math
from openpyxl.styles import Font, PatternFill, Alignment

# 视频格式
supported_formats = [
    '.mp4',
    '.avi',
    '.mkv',
    '.wmv',
    '.mov',
    '.flv',
    '.m2ts',
    '.ts',
    '.rm',
    '.rmvb',
    '.vob',
    '.3gp',
    '.webm',
    '.hdmov',
    '.mp4v',
    '.mpv4',
    '.divx',
    '.xvid',
    '.f4v',
    '.mpeg',
    '.asf',
    '.asx',
    '.m2t',
]

# 输出Excel路径
excel_folder = '.'

# 输出Excel文件名
excel_file = 'video_info.xlsx'

# 正则表达式匹配码率数据中的空格
pattern = re.compile(r'(\d+)\s+(\d+)')

# 创建Excel文件
wb = openpyxl.Workbook()
ws = wb.active
ws.title = 'Video Info'

# 锁定表头
ws.freeze_panes = 'A2'

# 设置表头样式
header_font = Font(bold=True, color='800080')  # 紫色
header_fill = PatternFill('solid', fgColor='C5E0B4')
header_alignment = Alignment(horizontal='center', vertical='center')
headers = [
    '文件名',
    '文件路径',
    '格式',
    '大小',
    '时长',
    '分辨率',
    '码率',
    '帧率',
    '音频码率',
    '音频采样率',
    '音频语言',
    '压缩比率',
]
for col, header in enumerate(headers, start=1):
    cell = ws.cell(row=1, column=col, value=header)
    cell.font = header_font
    cell.fill = header_fill
    cell.alignment = header_alignment

# 处理失败文件个数
failed_count = 0

# 总计处理文件数
total_count = 0

# 遍历所有视频文件
success_count = 0
row = 2  # 从第二行开始写入数据

def process_video(video_file):
    global success_count, row, failed_count, total_count
    try:
        # 获取文件名
        file_name = os.path.basename(video_file)

        # 获取文件大小并进行单位换算
        size = os.path.getsize(video_file)
        if size < 1024:
            size_str = f'{size} B'
        elif size < 1024 * 1024:
            size_str = f'{size / 1024:.2f} KiB'
        elif size < 1024 * 1024 * 1024:
            size_str = f'{size / 1024 / 1024:.2f} MiB'
        else:
            size_str = f'{size / 1024 / 1024 / 1024:.2f} GiB'

        # 使用mediainfo获取视频信息 / 音频信息
        video_result = subprocess.run(
            [
                'mediainfo',
                '--Inform=Video;%Format%|%Width%x%Height%|%BitRate/String%|%FrameRate%|%Duration/String3%',
                video_file,
            ],
            stdout=subprocess.PIPE,
        )
        video_output = video_result.stdout.decode().strip()
        audio_result = subprocess.run(
            [
                'mediainfo',
                '--Inform=Audio;%BitRate/String%|%SamplingRate/String%|%Language/String%',
                video_file,
            ],
            stdout=subprocess.PIPE,
        )
        audio_output = audio_result.stdout.decode().strip()

        # 解析输出结果
        video_info = video_output.split('|')
        audio_info = audio_output.split('|')

        # 处理多音轨情况
        audio_bitrate = []
        audio_sampling_rate = []
        audio_lang = []
        for i in range(len(audio_info) // 3):
            audio_bitrate.append(audio_info[i * 3])
            audio_sampling_rate.append(audio_info[i * 3 + 1])
            audio_lang.append(audio_info[i * 3 + 2])

        # 时长取整
        duration = video_info[4].split('.')[0]
        h, m, s = duration.split(':')
        duration = f'{h}:{m}:{str(s).zfill(2)}'

        # 以分钟计算的时长 2
        duration_minutes = int(h) * 60 + int(m) + math.ceil(float(s)) / 60

        # 计算压缩比率
        ratio = round(duration_minutes / size * 1000000000, 2)

        # 使用正则表达式替换码率数据中第一个数字和第二个数字之间的空格
        bitrate = re.sub(pattern, r'\1\2', video_info[2])

        # 写入Excel文件
        ws.cell(row=row, column=1, value=file_name)
        ws.cell(row=row, column=2, value=os.path.dirname(video_file))  # 写入文件夹路径
        ws.cell(row=row, column=3, value=video_info[0])
        ws.cell(row=row, column=4, value=size_str)
        ws.cell(row=row, column=5, value=duration)
        ws.cell(row=row, column=6, value=video_info[1])
        ws.cell(row=row, column=7, value=bitrate)
        ws.cell(row=row, column=8, value=video_info[3])
        ws.cell(row=row, column=9, value=' / '.join(audio_bitrate))
        ws.cell(row=row, column=10, value=' / '.join(audio_sampling_rate))
        ws.cell(row=row, column=11, value=' / '.join(audio_lang))
        ws.cell(row=row, column=12, value=ratio)
        # 打印进度
        success_count += 1
        row += 1

    except Exception as e:
        # 处理失败,跳过并打印文件名和具体错误信息
        failed_count += 1
        print(f'处理文件 {video_file} 时失败:{e}')
        # 将失败的文件写入到err.txt
        with open('err.txt', 'a') as f:
            f.write(f'{video_file}\n')
        return False

    return True

def process_folder(video_folder):
    global total_count
    # 获取视频文件列表(包括子目录)
    video_files = []
    for root, dirs, files in os.walk(video_folder):
        for file in files:
            for format in supported_formats:
                if file.endswith(format):
                    video_files.append(os.path.join(root, file))
                    break
    for video_file in video_files:
        if process_video(video_file):
            print(f'已处理 {success_count}/{total_count} 共计', end='\r')
        total_count += 1

# 处理单个视频或者视频文件夹
path = input('请输入视频路径:')
if os.path.isfile(path):
    process_video(path)
    total_count += 1
elif os.path.isdir(path):
    process_folder(path)

# 调整L列左对齐
l_col = ws['L']
for cell in l_col:
    cell.alignment = Alignment(horizontal='left')  # 左对齐

# 固定列宽
for col in ws.columns:
    col_letter = col[0].column_letter
    if col_letter not in ['C', 'H']:  # 不固定格式、fps列的宽度
        ws.column_dimensions[col_letter].width = 11

# 保存Excel文件
if not os.path.exists(excel_folder):
    os.makedirs(excel_folder)
excel_file_path = os.path.join(excel_folder, excel_file)
wb.save(excel_file_path)

# 打印处理失败文件个数和总计处理文件数
print(
    f'已完成,处理成功 {success_count} 个文件,处理失败 {failed_count} 个文件,视频信息已保存到 {excel_file_path}'
)

使用说明:

  1. 确保系统中已经安装了 mediainfoopenpyxl 库。
  2. 运行代码,输入要处理的视频路径或文件夹路径。
  3. 代码会自动提取视频信息并保存到 video_info.xlsx 文件中。

注意事项:

  • 如果遇到错误,请检查 err.txt 文件,查看失败的文件名和具体错误信息。
  • 该代码仅支持常见的视频格式,如果需要支持其他格式,请修改 supported_formats 列表。

功能改进:

  • 支持单个视频和文件夹的批量处理,方便用户操作。
  • 使用 mediainfo 工具提取视频信息,更加准确和全面。
  • 将结果保存到 Excel 文件中,方便用户查看和分析。
  • 代码包含了错误处理机制,可以有效避免程序崩溃。

未来改进方向:

  • 支持更多视频格式。
  • 支持自定义输出文件路径和文件名。
  • 支持将提取结果保存到其他格式的文件中。
  • 支持将提取结果进行可视化分析。

希望这份代码能够帮助到您!

Python 批量视频信息提取工具:支持单个视频和文件夹处理

原文地址: https://www.cveoy.top/t/topic/mFBA 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录