在线教育市场投资事件数据分析:领域估值排名
'数据集为2015-2020年在线教育市场的投资事件信息汇总 数据字段说明: ▪ 时间:投资事件发生的时间,格式为:年/月/日。 ▪ 公司名称:被投资的公司名称。 ▪ 公司网址:被投资公司在信息披露网站的主页URL。 ▪ 融资轮次:融资轮次。 ▪ 投资金额:融资金额,单位有人民币、美元等不同货币。该字段的值有多种类型,包括:明确金额、金额范围、未披露。(读入数据后应换算成统一单位,金额范围按中值记录,未披露按0记录) ▪ 投资人:投资人,有单个投资人、多个投资人、未披露。 ▪ 最新估值(估算):投资后,被投资公司的估值。估值=投资人投资金额/投资人所占股权比例。 ▪ 字段1:被投资公司所在的领域(一级)。 ▪ 字段2:被投资公司所在的领域(二级)。 ▪ 字段3:被投资公司所在的领域(三级)。 请统计:列出所有的一级领域,统计每个领域的总估值,并按照估值降序排列,估值相同按领域升序。最后将结果写入result.txt文件中。'
用py写出内容:读取JSON文件并进行数据处理和统计的代码如下:
import json
# 定义全局变量,记录每个一级领域的总估值
field_total = {}
# 读取JSON文件
with open('data.json', 'r', encoding='utf-8') as f:
data = json.load(f)
# 遍历每个投资事件
for item in data:
# 获取领域信息
field1 = item['字段1']
# 如果该领域为一级领域,则统计总估值
if field1 not in field_total:
field_total[field1] = item['最新估值(估算)']
else:
field_total[field1] += item['最新估值(估算)']
# 按照估值降序排列,估值相同按领域升序
result = sorted(field_total.items(), key=lambda x: (-x[1], x[0]))
# 将结果写入文件
with open('result.txt', 'w', encoding='utf-8') as f:
for item in result:
f.write('{} {}
'.format(item[0], item[1]))
print('结果已写入result.txt文件中。')
原文地址: http://www.cveoy.top/t/topic/oi0f 著作权归作者所有。请勿转载和采集!