-
题名基于簇特征的增量聚类算法
- 1
-
-
作者
姚琳燕
钱雪忠
樊路
-
机构
江南大学物联网技术应用教育部工程研究中心
-
出处
《传感器与微系统》
CSCD
2019年第1期152-154,共3页
-
基金
国家自然科学基金资助项目(61673193)
中央高校基础研究资助项目(JUSRP51510
JUSRP51635B)
-
文摘
针对传统聚类算法无法处理大规模数据的特点,结合增量算法和簇特征的思想,在初始聚类阶段,采用基于距离的K-means聚类算法获取相应簇的特征。根据簇特征,并结合K最近邻(KNN)的思想处理增量,提出了基于簇特征的增量聚类算法。提出的方法已经在加州大学尔湾分校(UCI)机器学习库中提供的真实数据集的帮助下得到验证。实验结果表明:提出的增量聚类方法的聚类精度较普通K-means算法和原始增量K-means算法有明显提高。
-
关键词
簇特征
增量
K最近邻
-
Keywords
cluster feature
increment
K-nearest neighbor(KNN)
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名面向稀疏高维大数据的扩展增量模糊聚类算法
被引量:19
- 2
-
-
作者
钱雪忠
姚琳燕
-
机构
江南大学物联网工程学院物联网技术应用教育部工程研究中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第6期75-81,88,共8页
-
基金
国家自然科学基金(61673193)
中央高校基本科研业务费专项资金(JUSRP51510,JUSRP51635B)
-
文摘
模糊C均值(FCM)聚类算法对初始中心点敏感,不考虑类别间中心点的相互影响,且仅能处理低维数据。为此,设计一种改进的初始中心点选择方法,并基于条件模糊聚类思想,将传统FCM算法中的欧氏距离替换为余弦距离后提出wHFCLM算法。将该算法与扩展增量聚类算法spFCM、oFCM和rseFCM相结合,得到对应的扩展增量模糊聚类算法spHF(c+l)M、oHF(c+l)M以及rseHF(c+l)M。实验结果表明,与spFCM算法、oFCM算法和rseFCM算法相比,扩展增量模糊聚类算法对初始中心点的选择敏感性较低,能较好地处理大规模稀疏高维数据集,且在合适的分块大小下具有更优的聚类性能。
-
关键词
扩展聚类算法
条件聚类
稀疏高维大数据
模糊聚类
初始中心点
-
Keywords
extended clustering algorithm
conditional clustering
sparse high-dimensional big data
fuzzy clustering
initial center
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于K近邻的增量式聚类算法
被引量:5
- 3
-
-
作者
樊路
钱雪忠
姚琳燕
-
机构
江南大学物联网工程学院智能系统与网络计算研究所
物联网技术应用教育部工程研究中心
江南大学物联网工程学院
-
出处
《传感器与微系统》
CSCD
2019年第2期136-139,共4页
-
基金
国家自然科学基金资助项目(61673193)
中央高校基本科研业务费专项资金资助项目(JUSRP51635B
JUSRP51510)
-
文摘
大多数聚类算法都是在静态情况下运行,使其不允许添加任何增量数据。提出了一种基于K近邻(KNN)的增量聚类算法,算法包含两个创新点,利用K近邻的思想和样本紧密度两个条件处理增量数据;根据簇特征的变化分裂或合并簇。实验表明:提出的算法既可以发现新簇,又能有效规避噪声点,且能够处理非球形的数据集。
-
关键词
K近邻
增量聚类
簇特征
-
Keywords
K-nearest neighbor(KNN)
incremental clustering
cluster feature
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-