期刊文献+

一种基于聚类和快速计算的异常数据挖掘算法 被引量:12

An Outlier Data Mining Algorithm Based on Clustering and Rapid Calculation
在线阅读 下载PDF
导出
摘要 传统局部离群因子(LOF)算法在动态增量数据库环境下,进行二次异常数据挖掘需重新计算所有数据对象局部偏离因子,存在效率较低的问题。为此,提出一种基于聚类和快速计算的异常数据挖掘算法。对传统DBSCAN算法进行改进,并且在该改进算法聚类的基础上,仅对部分数据对象计算局部偏离因子。实验结果表明,该算法在动态增量数据库环境下,与LOF与lncLOF算法相比,不仅计算时间效率高,而且能提高挖掘异常数据的精度。 The traditional Local Outlier Factor(LOF) algorithm need recalculate the local outlier factors of the all of data when does the second outlier mining in dynamic incremental database environment.This paper proposes an outlier mining algorithm based on clustering and rapid calculation.It improves the traditional DBSCAN algorithm,uses the improved DBSCAN algorithm to form a set of clusters,and computes the local outlier factors of the objects which are a part of dataset.Experimental results show that this algorithm performs better than LOF and lncLOF algorithm not only in the time consuming but also the accuracy of mining outliers.
作者 孟静 吴锡生
出处 《计算机工程》 CAS CSCD 2013年第8期60-63,68,共5页 Computer Engineering
基金 江苏省333高层次人才工程基金资助项目(BRA2010128)
关键词 动态增量数据库 局部离群因子算法 lncLOF算法 DBSCAN算法 聚类 dynamic incremental database Local Outlier Factor(LOF) algorithm lncLOF algorithm DBSCAN algorithm clustering
  • 相关文献

参考文献9

  • 1薛安荣,姚林,鞠时光,陈伟鹤,马汉达.离群点挖掘方法综述[J].计算机科学,2008,35(11):13-18. 被引量:69
  • 2Breunig M M,Kriegel H P,Ng R T,et al.LOF:IdentifyingDensity-based Local Outliers[C]//Proc.of ACM SIGMODConference.New York,USA:ACM Press,2000:427-438.
  • 3Zhang Ke,Hutter M,Jin Huidong.A New Local Distance-based Outlier Detection Approach for Scattered Real-worldData[C]//Proc.of PAKDD’09.Heidelberg,Germany:Springer,2009:813-822.
  • 4胡彩平,秦小麟.一种基于密度的局部离群点检测算法DLOF[J].计算机研究与发展,2010,47(12):2110-2116. 被引量:53
  • 5Sanjay C,Sun Pei.SLOM:A New Measure for Local SpatialOutliers[J].Knowledge and Information Systems,2006,9(4):412-429.
  • 6薛安荣,鞠时光,何伟华,陈伟鹤.局部离群点挖掘算法研究[J].计算机学报,2007,30(8):1455-1463. 被引量:96
  • 7杨风召,朱扬勇,施伯乐.IncLOF:动态环境下局部异常的增量挖掘算法[J].计算机研究与发展,2004,41(3):477-484. 被引量:34
  • 8Tang Jian,Chen Zhixiang,Fu A W C,et al.EnhancingEffectiveness of Outlier Detections for Low DensityPatterns[C]//Proc.of PAKDD’02.London,UK:Springer-Verlag,2002:535-548.
  • 9Ester M,Kriegel H P,Xu X.A Density-based Algorithm forDiscovering Clusters in Large Spatial Databases withNoise[C]//Proc.of the 2nd ACM SIGKDD’96.Portand,USA:[s.n.],1996:226-231.

二级参考文献95

共引文献219

同被引文献117

  • 1陆声链,林士敏.基于距离的孤立点检测研究[J].计算机工程与应用,2004,40(33):73-75. 被引量:44
  • 2王占全,王申康,华成.空间分类数据同位规则挖掘算法[J].计算机辅助设计与图形学学报,2005,17(10):2339-2344. 被引量:5
  • 3耿技,印鉴.改进的共享型最近邻居聚类算法[J].电子科技大学学报,2006,35(1):70-72. 被引量:5
  • 4刘波,潘久辉.基于群体智能的增量数据挖掘方法研究[J].计算机工程与设计,2006,27(11):1939-1942. 被引量:2
  • 5宋中山,成林辉,吴立峰.一种基于关联规则的增量数据挖掘算法[J].湖北大学学报(自然科学版),2006,28(3):240-243. 被引量:9
  • 6Jain A K,Murty M N,Flynn P J. Data clustering:A review[J]. ACM Computing Surveys, 1999,31 (3) : 264-323.
  • 7Zhang T, Ramakrishnan R, Livny M. Birch: An efficient data clustering method for very large databases[C]///Proceedings of the 1996 ACM SIGMOD International Conference on Manage- ment of Data. Montreal:ACM Press, 1996:103-114.
  • 8Guha S, Rastogi R, Shim K. Cure: An efficient clustering algo- rithrn for large databases[C]//Proceedings of the 1998 ACM SIGMOD International Conference on Management of Data. Seat- fie: ACM Press, 1998:73-84.
  • 9Cao F, Liang J, Bai L, et al. A framework for clustering categori-cal time-evolving data[J]. IEEE Transactions on Fuzzy Sys- tems, 2010,18 (5) : 872-882.
  • 10Chen H L,Chen M S,Lin S C. Catching the trend:A framework for clustering concept-drifting categorical data[J]. IEEE Tran- sactions on Knowledge and Data Engineering, 2009,21 (5) : 652- 665.

引证文献12

二级引证文献60

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部