大数据预处理技术都有哪些
发布网友
发布时间:2022-04-14 17:58
我来回答
共1个回答
热心网友
时间:2022-04-14 19:27
1)数据清理
数据清理例程就是通过填写缺失值、光滑噪声数据、识别或者删除离群点,并且解决不一致性来进行“清理数据”。
2)数据集成
数据集成过程将来自多个数据源的数据集成到一起。
3)数据规约
数据规约是为了得到数据集的简化表示。数据规约包括维规约和数值规约。
4)数据变换
通过变换使用规范化、数据离散化和概念分层等方法,使得数据的挖掘可以在多个抽象层面上进行。数据变换操作是提升数据挖掘效果的附加预处理过程。