阅读背景:

机器学习-PCA降维与DBScan聚类分析实战

来源:互联网 

基本概念:

  在数据处理中,经常会遇到特征维度比样本数量多得多的情况,如果拿到实际工程中去跑,效果不一定好。一是因为冗余的特征会带来一些噪音,影响计算的结果;二是因为无关的特征会加大计算量,耗费时间和资源。所以我们通常会对数据重新变换一下,再跑模型。  在数据处理中,经常会遇到特征维度比样本数量多得多的情况,如果拿到实际工程中




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: