期刊文献+

数据挖掘中原始数据质量问题的统计处理 被引量:3

Some statistical means to deal with data qualitative problems in data mining
在线阅读 下载PDF
导出
摘要 针对数据挖掘中亟需考虑的数据缺失、数据被污染等两类数据质量问题进行了相关分析,提出分别用于处理这些问题的统计方法. In data mining, there are two common qualitative problems of data. One is that the data is incomplete, i.e., some data are missing,the other is that some data are contaminated. Both problems are studied, and some statistical means are introduced to deal with them respectively.
出处 《山东大学学报(理学版)》 CAS CSCD 北大核心 2005年第3期57-61,共5页 Journal of Shandong University(Natural Science)
基金 山东省软科学资助项目(A2004241) 山东省社科规划研究项目(04BJZ46) 山东大学人文社会科学青年成长基金资助项目
关键词 数据挖掘 原始数据质量 统计处理 数据集 数据缺失 data mining data quality statistical means
  • 相关文献

参考文献7

  • 1DavidHand HeikkiMarmila PadhraicSmyth 张银奎 廖丽 宋俊译.数据挖掘原理[M].机械工业出版社,2003..
  • 2LITTLE, R J A.Statistical analysis with missing data[M]. New York: John Wiley, 1987.
  • 3Judi Scheffer. Dealing with missing data[J]. Res Lett Inf Math Sci, 2002 (3): 153 ~ 160.
  • 4茆诗松 王静龙 濮晓龙.高等数理统计[M].北京:高等教育出版社,2003..
  • 5王松桂.线性统计模型,线性回归与方差分析[M].北京:高等教育出版社,2002..
  • 6C.F.J. Wu. On the convergence properties of the em algorithm[J]. The Annals of Statistics, 1983, 11 (1): 95~ 103.
  • 7JeffreyD. Hart, Nonparametric smoothing and lack- of- fit tests[ M ]. New York: Springer, 1997.

共引文献53

同被引文献22

引证文献3

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部