写一个python脚本使用pandas模块用集合实现从参数1获取文件名该文件为文本文件以文件的每一行做为查询条件将同results-20230616T1300csv的id列一致的行打印id列和text列
下面是一个使用pandas模块的Python脚本,可以从参数1指定的文本文件中读取每一行作为查询条件,并打印与results-20230616T1300.csv文件中"id"列一致的行的"id"列和"text"列。
import pandas as pd
import sys
# 从参数1获取文件名
filename = sys.argv[1]
# 读取查询条件文件
with open(filename, 'r') as file:
query_conditions = file.readlines()
query_conditions = [condition.strip() for condition in query_conditions]
# 读取results-20230616T1300.csv文件
df = pd.read_csv('results-20230616T1300.csv')
# 使用集合实现查询并打印结果
for condition in query_conditions:
result = df[df['id'] == condition]
if not result.empty:
print(result[['id', 'text']])
请确保在运行脚本时,通过命令行将查询条件文件名作为参数传递给脚本。例如,假设脚本名为script.py,查询条件文件名为conditions.txt,则可以运行以下命令:
python script.py conditions.txt
注意:在运行脚本之前,需要安装pandas模块。可以使用以下命令来安装pandas:
pip install pandas
``
原文地址: https://www.cveoy.top/t/topic/idPK 著作权归作者所有。请勿转载和采集!