机器学习常见问题与概念解析
- 学习器训练时误差很小,泛化时性能下降,这种现象称为'过拟合现象'。
- 在聚类中,使用'距离度量'来定义相似性。
- 在k近邻法中,通常采用'交叉验证'来选取最优的k值。
- 聚类试图将样本划分为若干个不相交的子集,每个子集称为'簇'。
- 欧氏距离越小,两个点的相似度就越'高'。
- 模型评价指标的'召回率'是指判定为正类的正类样本占所有正类样本的比例。
- 采用one-hot编码后,将原来的n类一维特征扩充为'n'维布尔特征。
- AUC值越接近'1',说明模型的线性区分性能越好。
- AUC值越接近'0.5',说明模型的划分结果越接近随机划分。
- 欧氏距离越大,两个点的相似度就越'远'。
原文地址: https://www.cveoy.top/t/topic/ozUp 著作权归作者所有。请勿转载和采集!