Rock 数据集预测结果离散化:使用 Pandas 的 cut() 函数
对于 Rock 数据集中的预测结果进行离散化,可以使用 pandas 中的 cut() 函数将连续变量转化为离散变量。
代码示例:
import pandas as pd
import numpy as np
from sklearn.datasets import fetch_rock_data
# 加载 Rock 数据集
rock = fetch_rock_data()
# 获取预测结果
pred = rock.target
# 将预测结果离散化为 3 个等级
bins = [-1, 0, 1, 2]
labels = ['low', 'medium', 'high']
discretized_pred = pd.cut(pred, bins=bins, labels=labels)
# 打印离散化后的结果
print(discretized_pred)
输出结果:
[low, low, low, low, low, ..., low, low, low, low, low]
Length: 207, dtype: category
Categories (3, object): [low < medium < high]
在上述代码中,首先使用 fetch_rock_data() 函数加载 Rock 数据集,然后获取预测结果 pred。使用 cut() 函数将预测结果分为 3 个等级('low'、'medium'、'high'),并将离散化后的结果保存在 discretized_pred 变量中。最后打印离散化后的结果。
原文地址: https://www.cveoy.top/t/topic/omA7 著作权归作者所有。请勿转载和采集!