-
题名结合力导向图分布算法的特征加权深度嵌入聚类
- 1
-
-
作者
吕维
钱宇华
王婕婷
李飞江
胡深
-
机构
山西大学计算机与信息技术学院
计算智能与中文信息处理教育部重点实验室
山西大学大数据科学与产业研究院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第6期1318-1324,共7页
-
基金
国家自然科学基金重点项目(62136005)资助
国家自然科学基金青年科学基金项目(62106132)资助
+1 种基金
国家重点研发计划项目(2021ZD0112400)资助
山西省基础研究计划项目(20210302124271,202103021223026)资助。
-
文摘
聚类分析作为无监督学习领域的一个重要研究方向,是许多数据驱动应用的核心.但是高维数据特有的高维距离趋同特性,使得高维空间样本近邻结构遭到破坏,从而使得大量基于距离(基于近邻)的聚类算法性能急剧下降.目前,大量研究者认为,高维数据往往包含大量与任务不相关特征及相互关联的特征,其真实特征维度往往要比原始特征维度低很多.在学习样本低维等价表示上,基于深度自编码器的深度嵌入学习尽可能地保留重构信息.然而,现有此类方法往往需要聚类损失引导聚类,这虽然提高了聚类性能,但聚类损失与重构损失间的内在矛盾,限制了聚类性能的进一步提高.基于力导向图分布算法的降维算法则是尽可能保留近邻结构信息的基础上学习样本低维表示,但是高维距离趋同的特性使得此类算法较难准确获取样本高维近邻结构信息.本文在深度自编码器与力导向图分布算法的基础上引入特征加权思想,使模型在具有强大的低维等价表示能力及根据数据近邻结构凸显簇结构能力的同时考虑特征对聚类任务的适合程度.5个数据集上与最新高维聚类算法的对比实验充分证明了本文算法的合理性与优越性.
-
关键词
高维聚类
深度自编码器
特征加权
力导向图分布算法
-
Keywords
high-dimensional clustering
deep auto-encoder
feature weighting
force-directed graph distribution algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-