使用 Pandas 去除数据列

以下代码演示了如何使用 Pandas 库从 'train.csv' 文件读取股票数据,并去除 'Close_Price' 列。

stock_sales = pd.read_csv(
    comp_dir / 'train.csv',
    usecols=['Data_ID', 'Time', 'Close_Price'],
    dtype={
        'Data_ID': 'int',
        #'Time': 'datetime64',
        'Close_Price': 'float32',
    },
    parse_dates=['Time'],
    infer_datetime_format=True,
)

# 去除 'Close_Price' 列
x = stock_sales.drop('Close_Price', axis=1)

解释:

  1. pd.read_csv():使用 Pandas 库读取 'train.csv' 文件,并指定要读取的列('Data_ID', 'Time', 'Close_Price')。
  2. dtype:指定列的数据类型,'Data_ID' 为整数类型,'Close_Price' 为浮点数类型。
  3. parse_dates:将 'Time' 列解析为日期时间类型。
  4. infer_datetime_format:自动推断日期时间格式。
  5. stock_sales.drop():使用 drop() 方法去除 'Close_Price' 列,axis=1 表示按列进行操作。

通过以上步骤,我们成功地从股票数据中去除了 'Close_Price' 列,得到了新的 DataFrame 对象 x,可以使用 x 进行后续的数据分析和机器学习建模。

Pandas 数据处理:去除 'Close_Price' 列

原文地址: https://www.cveoy.top/t/topic/ocgj 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录