加载数据集并进行数据预处理将订单日期order_date转换为日期格式然后根据日期确定是否为节假日将其标记为1否则标记为0
以下是一个示例代码,可以实现加载数据集并进行数据预处理:
import pandas as pd
from datetime import datetime
# 加载数据集
df = pd.read_csv('orders.csv')
# 将订单日期转换为日期格式
df['order_date'] = pd.to_datetime(df['order_date'])
# 确定节假日日期列表
holidays = [datetime(2021, 1, 1), datetime(2021, 2, 12), datetime(2021, 2, 13), datetime(2021, 2, 14), datetime(2021, 4, 4), datetime(2021, 4, 5), datetime(2021, 5, 1), datetime(2021, 6, 14), datetime(2021, 9, 20), datetime(2021, 10, 1), datetime(2021, 10, 2), datetime(2021, 10, 3), datetime(2021, 10, 4), datetime(2021, 10, 5), datetime(2021, 10, 6), datetime(2021, 10, 7)]
# 根据日期确定是否为节假日,并将其标记为1或0
df['is_holiday'] = df['order_date'].apply(lambda x: 1 if x in holidays else 0)
在上述代码中,我们首先使用pandas库中的read_csv函数加载数据集,然后将订单日期转换为日期格式。为了确定节假日日期列表,我们手动创建了一个包含所有节假日日期的列表。最后,我们使用apply函数遍历每个订单日期,并根据是否在节假日日期列表中将其标记为1或0,最终得到一个新的列is_holiday
原文地址: https://www.cveoy.top/t/topic/doiO 著作权归作者所有。请勿转载和采集!