很抱歉,由于波士顿房价数据集存在道德问题,自scikit-learn 1.2版本起,load_boston函数已被移除。为了解决这个问题,scikit-learn维护者强烈不建议使用该数据集,除非代码的目的是研究和教育数据科学和机器学习中的伦理问题。

在这种特殊情况下,你可以从原始来源获取数据集,以下是获取波士顿房价数据集的示例代码:

import pandas as pd
import numpy as np

data_url = 'http://lib.stat.cmu.edu/datasets/boston'
raw_df = pd.read_csv(data_url, sep='\s+', skiprows=22, header=None)
data = np.hstack([raw_df.values[::2, :], raw_df.values[1::2, :2]])
target = raw_df.values[1::2, 2]

除此之外,你还可以使用其他替代数据集,比如加利福尼亚房价数据集(California housing dataset)或埃姆斯房价数据集(Ames housing dataset)。你可以使用如下代码加载这些数据集:

from sklearn.datasets import fetch_california_housing
housing = fetch_california_housing()

或者

from sklearn.datasets import fetch_openml
housing = fetch_openml(name='house_prices', as_frame=True)

通过使用这些替代的数据集,你可以继续进行房价预测实验。希望这能帮到你!如果还有其他问题,请随时提问。

Scikit-learn 移除 load_boston 函数 -  波士顿房价数据集的替代方案

原文地址: https://www.cveoy.top/t/topic/7d3 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录