Python 代码:将 CSV 文件中的相同字符串分类并计数
假设我们有一个包含字符串的 CSV 文件,文件名为 'data.csv',内容如下:
string
apple
banana
orange
banana
orange
apple
grape
我们可以使用以下代码将相同的字符串分为一类,并计算每类有多少相同的,并保存到另一个 CSV 文件中:
import csv
# 读取数据
data = []
with open('data.csv', 'r') as f:
reader = csv.reader(f)
next(reader) # 跳过表头
for row in reader:
data.append(row[0])
# 分类计数
count = {}
for s in data:
if s not in count:
count[s] = 0
count[s] += 1
# 将结果保存到csv文件中
with open('result.csv', 'w', newline='') as f:
writer = csv.writer(f)
writer.writerow(['string', 'count'])
for s, c in count.items():
writer.writerow([s, c])
运行完上述代码后,会生成一个 'result.csv' 文件,文件内容如下:
string,count
apple,2
banana,2
orange,2
grape,1
可以看到,相同的字符串被分为了一类,并且每类有多少相同的被计算出来了。
原文地址: https://www.cveoy.top/t/topic/ox1y 著作权归作者所有。请勿转载和采集!