天气预报15天查询> 其他> 数据预处理的主要方法有哪些

数据预处理的主要方法有哪些

更新时间: 2020-10-11 00:00:00     

数据的预处理是指对所收集数据进行分类或分组前所做的审核、筛选、排序等必要的处理;主要方法有数据清理,数据集成,数据变换,数据归约等。

数据清理;数据清理例程通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据。主要是达到如下目标:格式标准化,异常数据清除,错误纠正,重复数据的清除。数据集成;数据集成例程将多个数据源中的数据结合起来并统一存储,建立数据仓库的过程实际上就是数据集成。数据变换;通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。数据归约;数据挖掘时往往数据量非常大,在少量数据上进行挖掘分析需要很长的时间,数据归约技术可以用来得到数据集的归约表示,它小得多,但仍然接近于保持原数据的完整性,并结果与归约前结果相同或几乎相同。

关键词: 数据 处理 主要 方法 哪些

如有意见、反馈、侵权或投诉等情况,请联系:

电话:
邮箱:

我们将会在48小时内给与处理!

版权所有 Copyright ? 2009-2020 tianqiyubao3.com

页面:/news/view-1574546/ | 耗时:0.9470 s | 内存:1.89 MB | 查询:4 | 缓存读取:4 写入:0 | 加载文件:23
select * from tbl_Articles WHERE ArticleID=1574546 LIMIT 0,1
select * from tbl_Articles_data WHERE ArticleID=1574546 LIMIT 0,1
select * from tbl_Articles_sphinx where id=1574546 LIMIT 0,1
SELECT ArticleID,Title FROM tbl_Articles WHERE ArticleID IN(1017118,1072753,1066616,1126583,1062626,1086518,1078332,1087793,1116877,1072837,1077240,1060301,1057064,1049958,1091304,1094607,1092331,1067265,1130462,980889,1057601,1121334,1077599,1080759,1110027,1069944,1063309,1088628,1067197,1046706) ORDER BY field (ArticleID,1017118,1072753,1066616,1126583,1062626,1086518,1078332,1087793,1116877,1072837,1077240,1060301,1057064,1049958,1091304,1094607,1092331,1067265,1130462,980889,1057601,1121334,1077599,1080759,1110027,1069944,1063309,1088628,1067197,1046706)