2015-2020年在线教育市场投资事件分析:投资人参与轮次和平均投资金额统计

数据集包含2015-2020年在线教育市场的投资事件信息,数据字段包括:

  • 时间:投资事件发生的时间,格式为:年/月/日。
  • 公司名称:被投资的公司名称。
  • 公司网址:被投资公司在信息披露网站的主页URL。
  • 融资轮次:融资轮次。
  • 投资金额:融资金额,单位有人民币、美元等不同货币。该字段的值有多种类型,包括:明确金额、金额范围、未披露。(读入数据后应换算成统一单位,金额范围按中值记录,未披露按0记录)
  • 投资人:投资人,有单个投资人、多个投资人、未披露。
  • 最新估值(估算):投资后,被投资公司的估值。估值=投资人投资金额/投资人所占股权比例。
  • 字段1:被投资公司所在的领域(一级)。
  • 字段2:被投资公司所在的领域(二级)。
  • 字段3:被投资公司所在的领域(三级)。

目标:

输入一个投资人,统计该投资人参与各融资轮次的次数和各轮次的平均投资金额,并按次数降序输出,次数相同按金额降序,金额也相同按照轮次升序。最后将结果写入result.txt文件中。

思路:

  1. 首先读入数据,将投资金额转换成统一单位,金额范围按中值记录,未披露按0记录;
  2. 遍历数据集,统计每个投资人参与各融资轮次的次数和总投资金额;
  3. 计算每个轮次的平均投资金额;
  4. 按照次数降序、金额降序、轮次升序排序输出;
  5. 将结果写入result.txt文件中。

Python 代码实现:

import pandas as pd

# 1. 读入数据,转换投资金额单位,处理未披露数据
def read_data(file_path):
    data = pd.read_csv(file_path)
    # ... (转换投资金额单位,处理未披露数据)
    return data

# 2. 统计每个投资人参与各融资轮次的次数和总投资金额
def count_investments(data, investor):
    investor_data = data[data['投资人'] == investor]
    investment_counts = investor_data['融资轮次'].value_counts()
    total_investments = investor_data.groupby('融资轮次')['投资金额'].sum()
    return investment_counts, total_investments

# 3. 计算每个轮次的平均投资金额
def calculate_average_amount(total_investments, investment_counts):
    average_amounts = total_investments / investment_counts
    return average_amounts

# 4. 排序输出
def sort_and_output(investment_counts, average_amounts):
    sorted_data = sorted(average_amounts.items(), key=lambda item: (-item[1], item[0]))
    with open('result.txt', 'w') as f:
        for round, amount in sorted_data:
            f.write(f'融资轮次: {round}, 次数: {investment_counts[round]}, 平均投资金额: {amount}
')

# 主函数
def main():
    file_path = 'data.csv'
    data = read_data(file_path)
    investor = '投资人A'
    investment_counts, total_investments = count_investments(data, investor)
    average_amounts = calculate_average_amount(total_investments, investment_counts)
    sort_and_output(investment_counts, average_amounts)

if __name__ == '__main__':
    main()

注意:

  • 上述代码仅供参考,具体实现需要根据实际数据情况进行调整。
  • 代码中使用了 pandas 库,需要安装该库:pip install pandas
  • 代码中 data.csv 是数据集的文件路径,需要根据实际情况修改。
  • 代码中 投资人A 是需要统计的投资人名称,需要根据实际情况修改。
2015-2020年在线教育市场投资事件分析:投资人参与轮次和平均投资金额统计

原文地址: https://www.cveoy.top/t/topic/objy 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录