下面是一个使用pandas模块的Python脚本,可以从参数1指定的文本文件中读取每一行作为查询条件,并打印与results-20230616T1300.csv文件中"id"列一致的行的"id"列和"text"列。

import pandas as pd
import sys

# 从参数1获取文件名
filename = sys.argv[1]

# 读取查询条件文件
with open(filename, 'r') as file:
    query_conditions = file.readlines()
query_conditions = [condition.strip() for condition in query_conditions]

# 读取results-20230616T1300.csv文件
df = pd.read_csv('results-20230616T1300.csv')

# 使用集合实现查询并打印结果
for condition in query_conditions:
    result = df[df['id'] == condition]
    if not result.empty:
        print(result[['id', 'text']])

请确保在运行脚本时,通过命令行将查询条件文件名作为参数传递给脚本。例如,假设脚本名为script.py,查询条件文件名为conditions.txt,则可以运行以下命令:

python script.py conditions.txt

注意:在运行脚本之前,需要安装pandas模块。可以使用以下命令来安装pandas:

pip install pandas
``

原文地址: https://www.cveoy.top/t/topic/idPK 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录