Python3 视频文件信息提取与优化

以下代码使用 Python3 提取视频文件信息，并对代码进行优化以提高可读性和效率。/n/npython/nimport os/nimport re/nimport subprocess/nimport math/n/n# 视频格式/nsupported_formats = ['.mp4', '.avi', '.mkv', '.wmv', '.mov', '.flv', '.m2ts', '.ts', '.rm', '.rmvb',/n '.vob', '.3gp', '.webm', '.hdmov', '.mp4v', '.mpv4', '.divx', '.xvid', '.f4v',/n '.mpeg', '.asf', '.asx', '.m2t']/n# 视频文件夹/nvideo_folder = '/home/115/up'/n# 正则表达式匹配码率数据中的空格/npattern = re.compile(r'(/d+)/s+(/d+)')/n/n# 获取视频文件列表（包括子目录）/nvideo_files = [os.path.join(root, file) for root, dirs, files in os.walk(video_folder) for file in files if any(file.endswith(format) for format in supported_formats)]/n/n# 定义文件大小单位转换函数/ndef format_size(size):/n if size < 1024:/n return f'{size} B'/n elif size < 1024 * 1024:/n return f'{size / 1024:.2f} KiB'/n elif size < 1024 * 1024 * 1024:/n return f'{size / 1024 / 1024:.2f} MiB'/n else:/n return f'{size / 1024 / 1024 / 1024:.2f} GiB'/n/n# 定义解析音频信息的函数/ndef parse_audio_info(audio_output):/n audio_info = audio_output.split('|')/n return [audio_info[i:i+3] for i in range(0, len(audio_info), 3)]/n/n# 定义打印文件信息的函数/ndef print_file_info(file_name, size_str, duration, video_info, audio_info, ratio):/n audio_lang = [info[2] for info in audio_info]/n audio_lang_str = ' / '.join(audio_lang) if audio_lang else 'N/A'/n print(f'{file_name}, {size_str}, {duration}, {video_info[1]}, {bitrate}, {framerate}, {audio_lang_str}, {ratio}')/n/n# 遍历所有视频文件/nfor video_file in video_files:/n # 获取文件名/n file_name = os.path.basename(video_file)/n/n # 获取文件大小并进行单位换算/n size = os.path.getsize(video_file)/n size_str = format_size(size)/n/n # 使用mediainfo获取视频信息 / 音频信息/n video_result = subprocess.run(['mediainfo', '--Inform=Video;%Format%|%Width%x%Height%|%BitRate/String%|%FrameRate%|%Duration/String3%', video_file], stdout=subprocess.PIPE)/n video_output = video_result.stdout.decode().strip()/n audio_result = subprocess.run(['mediainfo', '--Inform=Audio;%BitRate/String%|%SamplingRate/String%|%Language/String%', video_file], stdout=subprocess.PIPE)/n audio_output = audio_result.stdout.decode().strip()/n/n # 解析输出结果/n video_info = video_output.split('|')/n audio_info = parse_audio_info(audio_output)/n/n # 时长取整/n duration = video_info[4].split('.')[0]/n h, m, s = duration.split(':')/n duration = f'{h}:{m}:{str(s).zfill(2)}'/n/n # 以分钟计算的时长 2/n duration_minutes = int(h) * 60 + int(m) + math.ceil(float(s)) / 60/n/n # 计算压缩比率/n ratio = round(duration_minutes / size * 1000000000, 2)/n/n # 使用正则表达式替换码率数据中第一个数字和第二个数字之间的空格/n bitrate = ''.join(re.findall(r'//d+', video_info[2]))/n/n # 获取帧率/n try:/n framerate = float(video_info[3])/n except (ValueError, IndexError):/n framerate = None/n/n # 打印文件信息/n print_file_info(file_name, size_str, duration, video_info, audio_info, ratio)/n/n/n代码优化说明：/n/n1. 使用列表推导式和生成器表达式更高效地获取视频文件列表。/n2. 将文件大小单位换算的逻辑封装成 format_size 函数，使代码更易读。/n3. 使用正则表达式的 findall 方法更高效地匹配码率数据中的数字。/n4. 将音轨信息的处理逻辑封装成 parse_audio_info 函数，使代码更易读。/n5. 使用 try-except 语句处理帧率转换失败的异常。/n6. 将打印文件信息的逻辑封装成 print_file_info 函数，使代码更易读。/n/n代码优化后，代码结构更加清晰，可读性更强，效率也得到了提高。', 'content_html': '

以下代码使用 Python3 提取视频文件信息，并对代码进行优化以提高可读性和效率。

<code class=/'language-python/'>import os/nimport re/nimport subprocess/nimport math/n/n# 视频格式/nsupported_formats = ['.mp4', '.avi', '.mkv', '.wmv', '.mov', '.flv', '.m2ts', '.ts', '.rm', '.rmvb',/n                     '.vob', '.3gp', '.webm', '.hdmov', '.mp4v', '.mpv4', '.divx', '.xvid', '.f4v',/n                     '.mpeg', '.asf', '.asx', '.m2t']/n# 视频文件夹/nvideo_folder = '/home/115/up'/n# 正则表达式匹配码率数据中的空格/npattern = re.compile(r'(/d+)/s+(/d+)')/n/n# 获取视频文件列表（包括子目录）/nvideo_files = [os.path.join(root, file) for root, dirs, files in os.walk(video_folder) for file in files if any(file.endswith(format) for format in supported_formats)]/n/n# 定义文件大小单位转换函数/ndef format_size(size):/n    if size < 1024:/n        return f'{size} B'/n    elif size < 1024 * 1024:/n        return f'{size / 1024:.2f} KiB'/n    elif size < 1024 * 1024 * 1024:/n        return f'{size / 1024 / 1024:.2f} MiB'/n    else:/n        return f'{size / 1024 / 1024 / 1024:.2f} GiB'/n/n# 定义解析音频信息的函数/ndef parse_audio_info(audio_output):/n    audio_info = audio_output.split('|')/n    return [audio_info[i:i+3] for i in range(0, len(audio_info), 3)]/n/n# 定义打印文件信息的函数/ndef print_file_info(file_name, size_str, duration, video_info, audio_info, ratio):/n    audio_lang = [info[2] for info in audio_info]/n    audio_lang_str = ' / '.join(audio_lang) if audio_lang else 'N/A'/n    print(f'{file_name}, {size_str}, {duration}, {video_info[1]}, {bitrate}, {framerate}, {audio_lang_str}, {ratio}')/n/n# 遍历所有视频文件/nfor video_file in video_files:/n    # 获取文件名/n    file_name = os.path.basename(video_file)/n/n    # 获取文件大小并进行单位换算/n    size = os.path.getsize(video_file)/n    size_str = format_size(size)/n/n    # 使用mediainfo获取视频信息 / 音频信息/n    video_result = subprocess.run(['mediainfo', '--Inform=Video;%Format%|%Width%x%Height%|%BitRate/String%|%FrameRate%|%Duration/String3%', video_file], stdout=subprocess.PIPE)/n    video_output = video_result.stdout.decode().strip()/n    audio_result = subprocess.run(['mediainfo', '--Inform=Audio;%BitRate/String%|%SamplingRate/String%|%Language/String%', video_file], stdout=subprocess.PIPE)/n    audio_output = audio_result.stdout.decode().strip()/n/n    # 解析输出结果/n    video_info = video_output.split('|')/n    audio_info = parse_audio_info(audio_output)/n/n    # 时长取整/n    duration = video_info[4].split('.')[0]/n    h, m, s = duration.split(':')/n    duration = f'{h}:{m}:{str(s).zfill(2)}'/n/n    # 以分钟计算的时长 2/n    duration_minutes = int(h) * 60 + int(m) + math.ceil(float(s)) / 60/n/n    # 计算压缩比率/n    ratio = round(duration_minutes / size * 1000000000, 2)/n/n    # 使用正则表达式替换码率数据中第一个数字和第二个数字之间的空格/n    bitrate = ''.join(re.findall(r'//d+', video_info[2]))/n/n    # 获取帧率/n    try:/n        framerate = float(video_info[3])/n    except (ValueError, IndexError):/n        framerate = None/n/n    # 打印文件信息/n    print_file_info(file_name, size_str, duration, video_info, audio_info, ratio)/n

代码优化说明：

使用列表推导式和生成器表达式更高效地获取视频文件列表。
将文件大小单位换算的逻辑封装成 format_size 函数，使代码更易读。
使用正则表达式的 findall 方法更高效地匹配码率数据中的数字。
将音轨信息的处理逻辑封装成 parse_audio_info 函数，使代码更易读。
使用 try-except 语句处理帧率转换失败的异常。
将打印文件信息的逻辑封装成 print_file_info 函数，使代码更易读。

代码优化后，代码结构更加清晰，可读性更强，效率也得到了提高。</