摘要
统计方法有成熟的数学基础,可以很好的对数据进行解释,在数据挖掘中有着大量的运用。文章回顾了数据挖掘中常用的统计方法,包括传统的统计方法(回归分析、主成分分析、判别分析和聚类分析)和其他一些非机器学习的方法(模糊集、粗糙集和统计学习理论),分析了各种统计方法的优缺点。
Statistical techniques have mature bases of maths,enable to interpret characteristics of data and have much application in data mining.In this paper,we review statistical techniques used usually,including traditional statistical techniques and techniques which are not machine learning technique.The advantages and disadvantages of every statistical techniques are analyzed.
出处
《计算机测量与控制》
CSCD
2003年第12期914-917,共4页
Computer Measurement &Control
基金
国家重点基础研究发展规划项目(2001CB309405)
关键词
数据挖掘
统计方法
聚类分析
数据库
机器学习
模糊集
data mining
regression analysis
principal component analysis
discriminant analysis
clustering analysis
fuzzy set
rough set
support vector machine