写一个python脚本使用pandas模块不使用循环从参数1获取文件名该文件为文本文件以文件的每一行做为查询条件将同results-20230616T1300csv的id列一致的行打印id列和text列
以下是使用pandas模块编写的脚本,实现了从参数1获取文件名,将文件的每一行作为查询条件,打印与results-20230616T1300.csv文件中的“id”列一致的行的“id”列和“text”列。
import sys
import pandas as pd
def main():
# 获取文件名参数
filename = sys.argv[1]
# 读取查询条件文件
with open(filename, 'r') as file:
queries = file.readlines()
# 去除查询条件中的换行符
queries = [query.strip() for query in queries]
# 读取目标文件
target_file = 'results-20230616T1300.csv'
df = pd.read_csv(target_file)
# 使用查询条件进行筛选
filtered_df = df[df['id'].isin(queries)]
# 打印筛选结果的'id'列和'text'列
print(filtered_df[['id', 'text']])
if __name__ == "__main__":
main()
在命令行中运行该脚本时,需要提供一个文本文件作为参数1,例如:
python script.py conditions.txt
其中,conditions.txt是包含查询条件的文本文件。脚本会读取该文件的每一行作为查询条件,然后在results-20230616T1300.csv文件中查找与查询条件的'id'列一致的行,最后打印匹配结果的'id'列和'text'列
原文地址: https://www.cveoy.top/t/topic/idQA 著作权归作者所有。请勿转载和采集!