Python 代码:从多个 CSV 文件提取列并合并成新文件
以下是一个示例代码,可以从多个 CSV 文件中提取所需列并将其组成新的 CSV 文件:\n\npython\nimport pandas as pd\nimport glob\n\n# 要提取的列名称列表\ncolumns_to_extract = ['列名1', '列名2', '列名3']\n\n# 要读取的 CSV 文件路径\npath = '路径/到/CSV文件'\n\n# 获取文件夹中所有 CSV 文件的路径\nall_files = glob.glob(path + "/*.csv")\n\n# 创建一个空的 DataFrame 来存储提取的数据\ndata = pd.DataFrame()\n\n# 循环读取所有 CSV 文件并提取所需列\nfor filename in all_files:\n df = pd.read_csv(filename, usecols=columns_to_extract)\n data = pd.concat([data, df], axis=0, ignore_index=True)\n\n# 将提取的数据保存为新的 CSV 文件\ndata.to_csv('新的 CSV 文件路径', index=False)\n\n\n请注意,在此示例中,我们使用 pandas 库来读取和操作 CSV 文件。 glob 库用于获取指定文件夹中所有 CSV 文件的路径。usecols 参数用于指定要提取的列。pd.concat() 函数用于将所有数据合并为一个 DataFrame。最后,我们将新的 DataFrame 保存为新的 CSV 文件,使用 index=False 参数来避免将索引列保存到 CSV 文件中。
原文地址: https://www.cveoy.top/t/topic/oEzu 著作权归作者所有。请勿转载和采集!