以下是使用 Pandas 模块编写的 Python 脚本,实现了上述需求:\n\npython\nimport sys\nimport pandas as pd\n\n# 获取命令行参数 1 作为文件名\nfilename = sys.argv[1]\n\n# 读取参数 1 指定的文件的每一行作为查询条件\nwith open(filename, 'r') as file:\n queries = set([line.strip() for line in file])\n\n# 读取 results-20230616T1300.csv 文件\ndf = pd.read_csv('results-20230616T1300.csv')\n\n# 使用集合操作筛选出满足查询条件的行\nresult_df = df[df['id'].isin(queries)]\n\n# 将结果输出到 output.txt 文件\nresult_df[['id', 'text']].to_csv('output.txt', index=False)\n\n\n在命令行中执行脚本时,需要传入文件名作为参数 1,例如:\n\n\npython script.py queries.txt\n\n\n其中,script.py 是保存脚本的文件名,queries.txt 是包含查询条件的文本文件名。脚本会根据 queries.txt 中的每一行作为查询条件,从 results-20230616T1300.csv 文件中筛选出满足条件的行,并将结果输出到 output.txt 文件中。


原文地址: https://www.cveoy.top/t/topic/pWuF 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录