在线教育市场投资事件分析:2015-2020年二级领域投资情况统计
本数据集为2015-2020年在线教育市场的投资事件信息汇总,包含以下数据字段:
- 时间:投资事件发生的时间,格式为:年/月/日。
- 公司名称:被投资的公司名称。
- 公司网址:被投资公司在信息披露网站的主页URL。
- 融资轮次:融资轮次。
- 投资金额:融资金额,单位有人民币、美元等不同货币。该字段的值有多种类型,包括:明确金额、金额范围、未披露。(读入数据后应换算成统一单位,金额范围按中值记录,未披露按0记录)
- 投资人:投资人,有单个投资人、多个投资人、未披露。
- 最新估值(估算):投资后,被投资公司的估值。估值=投资人投资金额/投资人所占股权比例。
- 字段1:被投资公司所在的领域(一级)。
- 字段2:被投资公司所在的领域(二级)。
- 字段3:被投资公司所在的领域(三级)。
请统计:输入一个一级领域,列出该领域下所有的二级领域,并统计每个二级领域的投资总次数、投资总金额,并按照投资总次数降序排列,次数相同按照金额降序,金额相同按照领域升序。最后将结果写入result.txt文件中。
以下是Python代码:
import json
# 读入JSON文件
with open('data.json', 'r', encoding='utf-8') as f:
data = json.load(f)
# 定义函数,用于按照一级领域统计二级领域的投资情况
def count_investment_by_field1(field1):
# 定义一个空字典,用于存储每个二级领域的投资情况
field2_investment = {}
for item in data:
# 如果被投资公司所在的一级领域与输入的一级领域相同
if item['字段1'] == field1:
# 获取被投资公司所在的二级领域
field2 = item['字段2']
# 如果该二级领域还没有被记录过
if field2 not in field2_investment:
# 将该二级领域加入字典,并初始化其投资次数和总金额为0
field2_investment[field2] = {'投资次数': 0, '总金额': 0}
# 计算该投资事件的投资金额(假设所有投资金额都以人民币计算)
investment_amount = 0
if item['投资金额'] != '未披露':
if '亿' in item['投资金额']:
investment_amount = float(item['投资金额'].replace('亿', '')) * 100000000
elif '万' in item['投资金额']:
investment_amount = float(item['投资金额'].replace('万', '')) * 10000
else:
investment_amount = float(item['投资金额'])
# 更新该二级领域的投资次数和总金额
field2_investment[field2]['投资次数'] += 1
field2_investment[field2]['总金额'] += investment_amount
# 对二级领域按照投资总次数、投资总金额、领域升序排序
sorted_field2_investment = sorted(field2_investment.items(), key=lambda x: (-x[1]['投资次数'], -x[1]['总金额'], x[0]))
# 将结果写入result.txt文件中
with open('result.txt', 'w', encoding='utf-8') as f:
f.write('二级领域 投资次数 总金额\n')
for item in sorted_field2_investment:
f.write(f'{item[0]} {item[1]['投资次数']} {item[1]['总金额']:.2f}\n')
# 测试
count_investment_by_field1('在线教育')
原文地址: http://www.cveoy.top/t/topic/oiZ8 著作权归作者所有。请勿转载和采集!