期刊文献+
共找到4,050篇文章
< 1 2 203 >
每页显示 20 50 100
生成式人工智能领先企业专利布局实证分析——基于复杂网络分析与K均值聚类算法
1
作者 高山行 王慧 杨张博 《科技进步与对策》 北大核心 2025年第4期55-66,共12页
生成式人工智能(AIGC)技术对经济社会发展带来巨大挑战,现有研究多从技术规制、发展历程等方面展开,较少对AIGC领先企业专利布局进行深入分析。选取美国AIGC领域领先的14家初创公司和4家科技巨头,基于复杂网络分析方法和机器学习的K均... 生成式人工智能(AIGC)技术对经济社会发展带来巨大挑战,现有研究多从技术规制、发展历程等方面展开,较少对AIGC领先企业专利布局进行深入分析。选取美国AIGC领域领先的14家初创公司和4家科技巨头,基于复杂网络分析方法和机器学习的K均值聚类算法,利用专利IPC信息构建专利知识网络。研究发现,美国AIGC领先企业的专利布局聚焦于电数字数据处理、图形数据读取及呈现等技术领域;从专利布局知识宽度、知识深度、知识紧密程度、知识分离程度和知识一致性程度进行聚类,企业可分为三类,即专业玩家、大厂/领先者和创新者。同时,识别不同企业的核心知识领域和桥接知识领域,最后从算法、算力和数据方面为我国发展AIGC产业提出政策建议。 展开更多
关键词 生成式人工智能 AIGC 复杂网络 专利布局 K均值聚类
在线阅读 下载PDF
基于主成分分析算法和K均值聚类算法的药品库存分类管理
2
作者 唐蕾 邱磊 +1 位作者 俞佳慧 冀召帅 《医药导报》 北大核心 2025年第4期682-686,共5页
目的针对目前药品分类主观性较强、分类标准模糊、影响因素繁杂的问题,探讨一种科学的药品分类方法,以降低库存成本,提高库存的有效性。方法在北京某三级医院2021—2022年历史数据中随机抽取700种药品为研究对象,通过主成分分析(PCA)算... 目的针对目前药品分类主观性较强、分类标准模糊、影响因素繁杂的问题,探讨一种科学的药品分类方法,以降低库存成本,提高库存的有效性。方法在北京某三级医院2021—2022年历史数据中随机抽取700种药品为研究对象,通过主成分分析(PCA)算法和K均值聚类(K-means)算法对研究对象进行分类。结果确定轮廓系数为0.3470的分类数4为最佳分类数,将700种药品分为4类,其中有363种归为第一类,186种归为第二类,94种归为第三类,57种归为第四类。将该文研究的药品分类方法模拟运用到某三级医院2023年第二季度的药品库存管理中,模拟结果表明该分类方法能够降低库存成本,提高库存有效性。结论基于PCA算法和K-means聚类算法的药品分类方法能够为药品库存分类管理提供可靠依据。 展开更多
关键词 药品分 主成分分析算法 K均值聚类算法 药品库存管理
在线阅读 下载PDF
基于改进PCA-K均值聚类-特征值分析法的桁架式拱梁组合体系性能评估
3
作者 王亮 刘磊 +3 位作者 张伟 陈晓杰 桂成中 程雨 《河北工程大学学报(自然科学版)》 2025年第1期9-17,共9页
提出一种基于改进PCA-K均值聚类-特征值分析法的双层桥面桁架式拱梁组合体系桥梁性能评估算法,并应用于基于安全监测的双层桥面桁架式拱梁组合体系中的吊杆体系养护阶段性能评估。该算法主要包括监测数据采集、多源异构数据预处理、关... 提出一种基于改进PCA-K均值聚类-特征值分析法的双层桥面桁架式拱梁组合体系桥梁性能评估算法,并应用于基于安全监测的双层桥面桁架式拱梁组合体系中的吊杆体系养护阶段性能评估。该算法主要包括监测数据采集、多源异构数据预处理、关键因子确定、改进K均值聚类分析、目标阈值确定和基于特征值分析的性能评估等内容。通过收集桥梁性能监测数据,并对这些数据进行清洗,接着采用三次样条插值法对多源异构数据进行预处理。基于主成分分析法确定关键因子,并基于改进K均值聚类方法将性能参数数据分为三类。然后,基于有限元计算结果确定测点位置所对应的测点力学性能状态的目标阈值,通过将提取的均值与方差等特征值与目标阈值进行比较来评估桥梁性能状态。通过实例验证方法,并提出实际应用和未来研究方向的建议。研究表明,改进后K均值聚类方法与原始数据更接近,且相关系数最高,能够提高聚类分析的准确性和可靠性,基于改进PCA-K均值聚类-特征值分析法能够评估桥梁结构性能状态。 展开更多
关键词 拱梁组合体系 目标阈值 主成分分析法 K均值聚类 性能评估 数据预处理
在线阅读 下载PDF
噪声鉴别C均值聚类的滁菊花茶品质等级鉴别研究 被引量:1
4
作者 武斌 谢晨傲 +2 位作者 陈勇 武小红 贾红雯 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第8期2202-2207,共6页
近红外光谱检测技术可以通过探测近红外区域的光谱特征,反映所测样品内部有机物化学成分和结构信息。在分析物质成分时,近红外光谱通常会涉及到大量的波长数据,因此其维数往往比较高。同时,光谱会出现重叠和冗余等现象,会影响模型的性... 近红外光谱检测技术可以通过探测近红外区域的光谱特征,反映所测样品内部有机物化学成分和结构信息。在分析物质成分时,近红外光谱通常会涉及到大量的波长数据,因此其维数往往比较高。同时,光谱会出现重叠和冗余等现象,会影响模型的性能。提出一种噪声鉴别C均值聚类(NDCM)算法。NDCM将一种快速广义噪声聚类(FGNC)和模糊线性判别分析(FLDA)相结合,可实现模糊聚类过程中进行数据鉴别信息的提取和数据空间维度的压缩,以达到更高的聚类准确率。对滁菊花茶近红外光谱数据进行模糊C均值聚类(FCM)得到的模糊隶属度和聚类中心作为噪声鉴别C均值聚类(NDCM)的初始模糊隶属度和初始聚类中心,使NDCM具有聚类速度快,准确率高等优点。FCM算法对光谱噪声数据敏感,而NDCM算法在处理含噪声的光谱数据时能够表现出较好的性能。该研究选取特级滁菊、一级滁菊、二级滁菊三种品质等级的滁菊花茶作为实验样本,共计240个样本。实验使用便携式近红外光谱仪(NIR-M-F1-C)采集滁菊花茶的近红外光谱数据。用Savitzky-Golay滤波和多元散射校正(MSC)对滁菊花茶近红外光谱进行预处理,以减少光谱中掺杂的噪声和重叠信息。通过主成分分析(PCA)对采集到的400维光谱数据进行维度压缩降至6维。该研究使用线性判别分析(LDA)提取滁菊花茶光谱数据中的鉴别信息,并将数据空间维度进一步转换为2维。分别用FCM,FGNC和NDCM三种算法对处理后的数据进行聚类分析,以实现对滁菊花茶的准确分类。实验结果显示:当权重指数m=2.5时,FCM,FGNC,NDCM的聚类准确率分别为92.42%,98.48%,100%。NDCM聚类时间略长于FGNC。FCM算法需要进行27次迭代才能收敛,而FGNC算法和NDCM算法分别只需要13次和10次迭代就能达到收敛。采用近红外光谱技术结合MSC、Savitzky-Golay滤波、PCA、LDA和NDCM算法,建立了一种精准鉴别滁菊花茶品质等级的聚类模型。 展开更多
关键词 噪声鉴别C均值聚类 近红外光谱 无损检测 线性判别分析
在线阅读 下载PDF
采用混合策略联合优化的模糊C-均值聚类信息熵点云简化算法 被引量:1
5
作者 黄鹤 黄佳慧 +2 位作者 刘国权 王会峰 高涛 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第7期214-226,共13页
针对传统聚类算法处理点云简化问题时精度低、耗时长且易丢失特征信息等问题,提出了一种基于动态精英自适应混合策略的鹈鹕算法(DEAMPOA)与加权熵法联合优化的模糊C-均值聚类(FCM)信息熵点云简化算法。采用动态自适应种群混合策略,同时... 针对传统聚类算法处理点云简化问题时精度低、耗时长且易丢失特征信息等问题,提出了一种基于动态精英自适应混合策略的鹈鹕算法(DEAMPOA)与加权熵法联合优化的模糊C-均值聚类(FCM)信息熵点云简化算法。采用动态自适应种群混合策略,同时融合了精英反向化思路,显著提升了鹈鹕优化算法(POA)的收敛趋势和全局寻优能力,提高了寻找FCM最优聚类中心的成功率;利用DEAMPOA结合加权熵法对FCM进行优化,提高鲁棒性的同时增强了搜索精度,得到较好的聚类结果;在8种UCI标准数据集上与4种算法对比进行聚类性能评估实验,验证了所提方法综合性能优越;将所提方法与信息熵融合,并应用在三维点云KITTI数据集简化中。实验结果表明:与包围框简化法、随机采样简化法和特征选择简化法对比,所提方法全局误差简化前后点集之间平均欧式距离(MED)指标分别降低了2.25%、6.93%、5.74%,点云简化效果最优且运行速度满足要求。 展开更多
关键词 C-均值聚类 鹈鹕优化算法 点云简化 信息熵
在线阅读 下载PDF
基于改进K均值聚类的语音情感识别深度学习方法
6
作者 李巧君 郭彍 《计算机应用与软件》 北大核心 2024年第9期224-229,共6页
针对当前语音情感识别(Speech Emotion Recognition, SER)方法中准确性低和时间复杂度高的问题,提出一种基于改进K均值聚类的语音情感识别深度学习方法。采用改进的K-均值聚类算法从整个音频信号中选取反映情感特征的关键片段;使用短时... 针对当前语音情感识别(Speech Emotion Recognition, SER)方法中准确性低和时间复杂度高的问题,提出一种基于改进K均值聚类的语音情感识别深度学习方法。采用改进的K-均值聚类算法从整个音频信号中选取反映情感特征的关键片段;使用短时傅里叶变换将所选序列转化为一个谱图;利用深度残差模型ResNet和深度双向长短时记忆Bi-LSTM网络从空间和时间上学习表征谱图中与情感相关的隐藏特征,基于Softmax分类器获得最终的情感分类。实验结果表明,所提方法比其他识别方法具有明显的优势,在改善情感识别率的同时,降低了模型的处理时间。 展开更多
关键词 语音情感识别 深度双向长短时记忆 K-均值聚类 短时傅里叶变换
在线阅读 下载PDF
基于高斯滤波与均值聚类的异质多源传感器数据加权融合
7
作者 张丽 郭海涛 《传感技术学报》 CAS CSCD 北大核心 2024年第3期519-523,共5页
异质多源传感器之间工作频率存在差异,导致数据之间的一致性较差,加权融合后的观测误差较大,因此提出基于高斯滤波与均值聚类的异质多源传感器数据加权融合方法。采用高斯滤波对异质多源传感器数据空间单元格进行划分,建立基于单元格的... 异质多源传感器之间工作频率存在差异,导致数据之间的一致性较差,加权融合后的观测误差较大,因此提出基于高斯滤波与均值聚类的异质多源传感器数据加权融合方法。采用高斯滤波对异质多源传感器数据空间单元格进行划分,建立基于单元格的最佳连通域,保留传感器内部数据,完成传感器数据的高斯滤波平滑处理。引入均值聚类对异质多源传感器数据进行一致性处理。通过免疫粒子群搜索最优权重和参数,利用最优权重和参数完成异质多源传感器数据加权融合。仿真结果表明,所提方法能够降低融合后传感器数据的观测误差与均方误差,观测误差与均方误差最小值均为0.002。因此,说明所提方法提高了融合后异质多源传感器数据的可利用性。 展开更多
关键词 异质多源传感器 数据加权融合 高斯滤波 均值聚类
在线阅读 下载PDF
基于二分K均值聚类算法的电子档案存储技术
8
作者 许德斌 《辽东学院学报(自然科学版)》 CAS 2024年第2期120-128,共9页
为实现电子档案高质量安全存储,提出基于二分K均值聚类算法的电子档案存储技术。由档案所有者挑选适合自己档案的存储机构,在存储机构工作人员帮助下,使用基于二分K均值聚类算法的图像优化方法优化待存储的电子档案。将优化后的电子档... 为实现电子档案高质量安全存储,提出基于二分K均值聚类算法的电子档案存储技术。由档案所有者挑选适合自己档案的存储机构,在存储机构工作人员帮助下,使用基于二分K均值聚类算法的图像优化方法优化待存储的电子档案。将优化后的电子档案发送给星际文件系统,由档案存储机构予以保存并返回唯一Hash指纹,操作完成后通过公钥密码算法实施数字签名操作,并由档案所有者对数字签名结果实施合理验证,验证通过后生成最终的电子档案及数字签名,发送给以太网区块链完成存储。实验结果表明,所提技术可较好存储电子档案,能够有效提升电子档案文件存储的安全性和稳定性,极大程度节省电子档案存储空间。 展开更多
关键词 K均值聚类 电子档案 安全存储 区块链 星际文件系统 电子档案优化
在线阅读 下载PDF
可能性模糊C-均值聚类新算法 被引量:34
9
作者 武小红 周建江 《电子学报》 EI CAS CSCD 北大核心 2008年第10期1996-2000,共5页
模糊C-均值聚类(FCM)对噪声数据敏感和可能性C-均值聚类(PCM)对初始类中心非常敏感易导致一致性聚类.可能性模糊C-均值聚类(PFCM)综合了FCM和PCM算法并且克服了这些缺点.但是PFCM必须先运行FCM来计算参数.提出一种新的PCM算法,新的PCM... 模糊C-均值聚类(FCM)对噪声数据敏感和可能性C-均值聚类(PCM)对初始类中心非常敏感易导致一致性聚类.可能性模糊C-均值聚类(PFCM)综合了FCM和PCM算法并且克服了这些缺点.但是PFCM必须先运行FCM来计算参数.提出一种新的PCM算法,新的PCM算法利用协方差矩阵来计算参数衡量了数据集的紧凑程度且无须先运行FCM,在新的PCM和FCM基础上提出了新PFCM算法,该算法无须事先运行FCM以计算参数,减少了算法运算时间.对数据集的测试实验结果表明了提出的新算法能同时产生模糊隶属度和典型值,减少聚类时间,同时具有更好的分类准确率. 展开更多
关键词 模糊 模糊C-均值聚类 可能性C-均值聚类 可能性模糊C-均值聚类
在线阅读 下载PDF
基于K近邻加权的混合C均值聚类算法 被引量:2
10
作者 王超 姜威 《计算机工程与应用》 CSCD 北大核心 2006年第30期84-87,共4页
该文提出了一种基于K近邻加权的混合C均值聚类算法。首先该文利用模糊C均值聚类和可能性C均值聚类的优点,设计出一种混合C均值聚类算法。然后以K近邻规则为基础,计算出样本集的加权矩阵,最后得到基于K近邻加权的混合C均值聚类算法。由... 该文提出了一种基于K近邻加权的混合C均值聚类算法。首先该文利用模糊C均值聚类和可能性C均值聚类的优点,设计出一种混合C均值聚类算法。然后以K近邻规则为基础,计算出样本集的加权矩阵,最后得到基于K近邻加权的混合C均值聚类算法。由于该算法考虑到了不同样本点对分类的影响程度,对较复杂的样本集合,能明显提高分类的正确性和鲁棒性。 展开更多
关键词 混合C均值聚类 加权 模糊C均值聚类 可能性C均值聚类
在线阅读 下载PDF
基于改进模糊C均值聚类与SMO算法的地铁轨道健康状态评价
11
作者 许以凯 杨艺 +2 位作者 张明凯 赵才友 万壮 《铁道标准设计》 北大核心 2024年第11期53-59,共7页
轨道健康状态评价技术对于保障列车的运行安全与乘客的舒适性有重要意义,为寻求一种新的轨道设备综合评价方法,实现对轨道健康状态的科学评价,提出一种基于改进模糊C均值聚类和序列最小优化算法(SMO)构建轨道健康状态评估分析模型。该... 轨道健康状态评价技术对于保障列车的运行安全与乘客的舒适性有重要意义,为寻求一种新的轨道设备综合评价方法,实现对轨道健康状态的科学评价,提出一种基于改进模糊C均值聚类和序列最小优化算法(SMO)构建轨道健康状态评估分析模型。该模型首先提出包含轨道几何状态和结构状态的综合评价指标体系;其次采用变异系数法计算评价指标的权重系数并代入模糊C均值聚类法,得到各轨道样本的分类结果;在此基础上,再利用序列最小优化算法通过划分数据对轨道健康状态进行评价;最后通过实例分析对该评价模型进行验证并开展研究。研究结果表明,经模型评价的855个轨道单元评价结果中优良比例为94%,预测效果良好,平均误差为5%,进而验证了该模型的指标体系和评价方法的科学性和合理性,并给出了进一步研究优化的方向。本文对各轨道指标统筹综合评价,为地铁轨道工务管理线路质量评价提供一种新思路,使轨道设备管理变得有序可控,减少人力、物力资源的浪费。 展开更多
关键词 地铁 轨道 健康状态评价 变异系数法 模糊C均值聚类 SMO算法
在线阅读 下载PDF
抑制式模糊C-均值聚类研究综述 被引量:9
12
作者 范九伦 《西安邮电大学学报》 2014年第3期1-5,共5页
模糊C-均值聚类及其各种变形和推广在实际应用中取得了巨大成就,获得了国际学者的广泛认可。目前,国际上形成了以硬C-均值聚类、模糊C-均值聚类、可能性C-均值聚类为基础的三大聚类算法簇。抑制式模糊C-均值聚类算法架起了连接硬C-均值... 模糊C-均值聚类及其各种变形和推广在实际应用中取得了巨大成就,获得了国际学者的广泛认可。目前,国际上形成了以硬C-均值聚类、模糊C-均值聚类、可能性C-均值聚类为基础的三大聚类算法簇。抑制式模糊C-均值聚类算法架起了连接硬C-均值聚类算法和模糊C-均值聚类算法的一个桥梁,本文就抑制式模糊C-均值聚类的研究现状进行综述,以期对该算法的更深入研究和应用起到推动作用。 展开更多
关键词 硬C-均值聚类 模糊C-均值聚类 抑制式模糊C-均值聚类
在线阅读 下载PDF
基于改进K均值聚类的光伏板缺陷检测方法 被引量:2
13
作者 赵强 刘胜杰 +2 位作者 韩东成 刘常瑜 杨世植 《红外技术》 CSCD 北大核心 2024年第4期475-482,共8页
为了能够对光伏组件热斑部分准确地识别和提取,提出了一种基于HSV空间模型的改进K均值聚类图像处理方法。首先,将红外图像进行HSV空间转换和双边滤波处理,去除噪声并提高图像对比度;其次,使用高斯核函数估计实现图像灰度概率密度函数提... 为了能够对光伏组件热斑部分准确地识别和提取,提出了一种基于HSV空间模型的改进K均值聚类图像处理方法。首先,将红外图像进行HSV空间转换和双边滤波处理,去除噪声并提高图像对比度;其次,使用高斯核函数估计实现图像灰度概率密度函数提取,并以此获取初始聚类中心;最后,利用先验知识对图像进行K均值聚类,提取和量化热斑缺陷。研究结果表明,该方法能够快速地检测定位热斑位置并统计出光伏板损坏程度,具有较高的精度以及较好的灵敏性和稳定性。 展开更多
关键词 红外图像 缺陷检测 热斑 光伏板 HSV空间模型 改进K均值聚类
在线阅读 下载PDF
基于模糊C均值聚类的高铁动车组电缆终端局部放电识别
14
作者 杨燕花 陈珍宝 +4 位作者 曹晗 张彦林 刘凯 陈奎 高国强 《机车电传动》 2024年第3期156-163,共8页
局部放电检测作为一种诊断车载电缆终端绝缘状态的有效手段,在列车实际运行环境中面临强干扰问题,为此文章提出了一种基于波形参数分析和模糊C均值聚类的车载电缆终端局放脉冲干扰分离策略。在实验室搭建了局部放电测试平台并采用高频... 局部放电检测作为一种诊断车载电缆终端绝缘状态的有效手段,在列车实际运行环境中面临强干扰问题,为此文章提出了一种基于波形参数分析和模糊C均值聚类的车载电缆终端局放脉冲干扰分离策略。在实验室搭建了局部放电测试平台并采用高频电流法(HFCT)获取了电缆终端的局放信号和典型脉冲干扰信号,通过对脉冲单波进行包络处理,提取脉冲的3个参数作为特征向量,然后采用模糊C均值聚类方法对局放信号与脉冲干扰信号进行分离。试验结果表明,该方法能够有效地将局放信号与脉冲干扰信号分离,减小脉冲干扰信号对局部放电检测的影响,对提高局放手段评估车载电缆终端绝缘状态的准确性具有一定意义。 展开更多
关键词 动车组 电缆终端 局部放电 脉冲干扰 模糊C均值聚类
在线阅读 下载PDF
基于改进K均值聚类的光谱重建训练样本选择研究 被引量:1
15
作者 刘振 刘莉 +2 位作者 樊硕 赵安然 刘思鲁 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第1期29-35,共7页
光谱反射率重建过程中,训练样本的选择方法及样本容量与重建精度密切相关,寻找一种高效的训练样本选择方法是光谱重建的目标之一。K均值聚类计算复杂度小,计算效率高,但因聚类初始值选择的随机性,以及离群点的影响致使聚类结果不稳定,... 光谱反射率重建过程中,训练样本的选择方法及样本容量与重建精度密切相关,寻找一种高效的训练样本选择方法是光谱重建的目标之一。K均值聚类计算复杂度小,计算效率高,但因聚类初始值选择的随机性,以及离群点的影响致使聚类结果不稳定,进而影响光谱重建的精度。基于此,提出了一种改进K均值聚类的训练样本选择方法。首先,将训练样本集的几何中心作为聚类中心的初始值;其次,基于高斯函数构建样本空间分布概率密度函数,并以欧几里德(欧式)距离作为其他聚类中心的度量依据;最后,在训练样本集中,基于簇内平方差度量光谱反射率样本间的相似度,将每个聚类子集中与中心距离最近的样本作为训练样本。为验证该方法的有效性,通过主成分分析法进行光谱重建。实验结果表明,所提的方法相较于传统的方法,光谱重建精度有一定的提高,重建光谱的平均均方根误差小于4%, CIE DE2000色差小于3.756 7。提出的改进的K均值聚类的训练样本选择方法,能够一定程度上提高了光谱重建精度,基本满足复制再现图像的要求。 展开更多
关键词 光谱重建 训练样本 算法 改进K均值聚类
在线阅读 下载PDF
基于空间信息的鲁棒模糊C均值聚类的苗族服饰图像分割算法 被引量:1
16
作者 覃小素 黄成泉 +3 位作者 彭家磊 陈阳 雷欢 周丽华 《毛纺科技》 CAS 北大核心 2024年第1期91-98,共8页
针对苗族服饰图像中破损污渍、折叠痕迹、色彩差异大和噪声破坏等现象所导致的传统模糊C均值聚类(Fuzzy C-means,FCM)算法分割质量不佳问题,提出了基于空间信息鲁棒FCM算法,用于苗族服饰图像分割。通过均值滤波和中值滤波处理空间邻域信... 针对苗族服饰图像中破损污渍、折叠痕迹、色彩差异大和噪声破坏等现象所导致的传统模糊C均值聚类(Fuzzy C-means,FCM)算法分割质量不佳问题,提出了基于空间信息鲁棒FCM算法,用于苗族服饰图像分割。通过均值滤波和中值滤波处理空间邻域信息,对应获得2种方法,并用一个加权参数调节模糊隶属度的稀疏性,旨在加强细节的提取和提高算法对噪声的鲁棒性。实验表明,对于被高斯噪声破坏的图像,基于均值滤波处理的改进算法,其划分系数提高约3.6%,划分熵降低约5.6%;对于被椒盐噪声破坏的图像,基于中值滤波处理的空间约束项的改进算法,划分系数提高约2.7%,划分熵降低约4.3%。该算法提高了对这类苗族服饰图像分割的质量,对于传统文化的传承具有非凡的意义。 展开更多
关键词 苗族服饰图像 模糊C均值聚类 均值滤波 中值滤波 模糊隶属度的稀疏性
在线阅读 下载PDF
基于高斯核函数的差分隐私模糊C均值聚类算法的构建与应用 被引量:1
17
作者 曹自雄 陈宇鲜 蒋秀梅 《中国医学装备》 2024年第8期106-112,共7页
目的:提出一种基于高斯核函数的差分隐私模糊C均值聚类算法(DPFCM_GF),旨在优化大数据背景下医疗数据分析和挖掘带来的数据隐私安全问题,为数据隐私保护提供理论基础。方法:针对随机初始化模糊C-均值隶属度矩阵降低算法精度问题,采用最... 目的:提出一种基于高斯核函数的差分隐私模糊C均值聚类算法(DPFCM_GF),旨在优化大数据背景下医疗数据分析和挖掘带来的数据隐私安全问题,为数据隐私保护提供理论基础。方法:针对随机初始化模糊C-均值隶属度矩阵降低算法精度问题,采用最大距离法确定初始中心点,使用聚类中心点的高斯值计算隐私预算分配比率,并添加拉普拉斯噪声以完成差分隐私保护,构建DPFCM_GF。收集整理美国加州大学欧文分校机器学习存储库的心脏病、乳腺癌、甲状腺疾病及糖尿病公开数据集对DPFCM_GF有效性进行验证,收集2019年1月1日至2022年12月31日淮安市第二人民医院收治的756例胃癌和肺癌患者病例数据集,对DPFCM_GF的可用性进行验证,并将分析结果与模糊C均值聚类算法(FCM)以及差分隐私模糊C均值聚类算法(DPFCM)进行对比分析。结果:对于心脏病、乳腺癌、甲状腺疾病及糖尿病公开数据集,DPFCM_GF和DPFCM的最优聚类效果与FCM聚类效果相当;相较于DPFCM,DPFCM_GF迭代时间更快,聚集速度显著,差异有统计学意义(t=4.01、4.71、4.01、12.38,P<0.05)。对于肺癌和胃癌数据集,随着隐私预算ε的增大,DPFCM_GF正确识别率逐渐聚集于91.9%和93.9%,受试者工作特征(ROC)曲线下面积(AUC)值分别为0.79和0.81;当隐私函数ε为0.1、0.5、1和2(ε<3)时,DPFCM_GF聚类效果显著优于DPFCM,且聚类效果更佳,差异有统计学意义(χ^(2)=12.25、87.12、68.58、7.76,P<0.05;χ^(2)=4.74、43.51、42.47、4.89,P<0.05)。结论:DPFCM_GF是一种有效保护医疗数据隐私的方法,同时也可进行数据分析和挖掘任务,具有一定的研究意义和研究前景。 展开更多
关键词 数据隐私 差分隐私 模糊C均值聚类算法 高斯核函数 数据挖掘 隐私预算
在线阅读 下载PDF
基于K均值聚类算法的谐振接地系统故障区段定位方法 被引量:1
18
作者 黄劼 汪逸帆 +2 位作者 林叶青 胡荔丹 王丹豪 《电气技术》 2024年第3期24-31,37,共9页
现有的谐振接地配电网单相接地故障定位方法存在通信依赖过度、特征分析复杂和阈值设置困难等问题,现场运行的适用性较低。本文基于深度融合智能开关在配电网中的应用,研究三相电流变化量的波形特征,提出基于K均值聚类算法的就地选段方... 现有的谐振接地配电网单相接地故障定位方法存在通信依赖过度、特征分析复杂和阈值设置困难等问题,现场运行的适用性较低。本文基于深度融合智能开关在配电网中的应用,研究三相电流变化量的波形特征,提出基于K均值聚类算法的就地选段方法。该方法提取各区段数据特征量,发挥K均值聚类算法无监督学习的优点,使各检测节点只需处理本地故障信号,从而减轻通信压力。利用仿真和现场数据验证该方法的可行性,结果表明,该方法在多种故障工况下都表现出较高的可靠性,并且能够较好地适应现场环境。 展开更多
关键词 谐振接地系统 单相接地故障 就地选段 K均值聚类 非监督学习
在线阅读 下载PDF
引导模糊C均值聚类算法在联合反演综合解释中的应用
19
作者 陈易周 刘江 +2 位作者 涂齐催 李炳颖 娄敏 《石油地球物理勘探》 EI CSCD 北大核心 2024年第4期865-874,共10页
不同地球物理方法的反演结果常常存在差异,根据不同方法的联合反演结果得到最终合理解释是了解地下结构的关键。为此,提出了一种引导式模糊C均值(FCM)聚类算法,即在FCM聚类算法的基础上,结合现有地质认识,引入先验约束信息指导聚类中心... 不同地球物理方法的反演结果常常存在差异,根据不同方法的联合反演结果得到最终合理解释是了解地下结构的关键。为此,提出了一种引导式模糊C均值(FCM)聚类算法,即在FCM聚类算法的基础上,结合现有地质认识,引入先验约束信息指导聚类中心的确定,对地球物理联合反演结果进行综合定量解释,旨在降低传统人工解释的主观性和局限性。模型测试表明,与传统FCM聚类技术相比,引导FCM聚类技术效果更好,特别是处理复杂地质结构的反演数据时,能够有效地区分不同地质体。实际数据的应用结果证明了引导FCM聚类技术在多属性地球物理联合反演结果综合解释中的应用潜力较大。该技术不仅提升了地球物理数据解释的科学性,而且为地下资源勘探提供了一个更可靠和精确的工具。 展开更多
关键词 模糊C均值聚类 联合反演 综合解释 先验约束信息 多属性
在线阅读 下载PDF
基于自适应近邻信息的模糊C均值聚类算法
20
作者 高云龙 李建鹏 +3 位作者 郑兴莘 邵桂芳 祝青园 曹超 《光学精密工程》 EI CAS CSCD 北大核心 2024年第7期1045-1058,共14页
传统的模糊C均值算法直接基于原始数据进行聚类,数据的内在结构可能会被噪声、异常值或其他因素破坏,因此聚类性能会受到影响。为提升FCM算法的鲁棒性,提出了一种基于自适应近邻信息的模糊C均值聚类算法。近邻信息指的是一种基于数据点... 传统的模糊C均值算法直接基于原始数据进行聚类,数据的内在结构可能会被噪声、异常值或其他因素破坏,因此聚类性能会受到影响。为提升FCM算法的鲁棒性,提出了一种基于自适应近邻信息的模糊C均值聚类算法。近邻信息指的是一种基于数据点之间相似度的度量,每个数据点都可以看作其他数据点的近邻,但是不同数据点之间的相似度是不同的。将样本点的近邻信息GX和类中心点的近邻信息GV融入基础FCM模型中,为聚类过程提供更多的数据结构信息,用于指导聚类算法中的簇划分过程,以提升算法的稳定性,并提出了3个迭代算法求解本文提出的聚类模型。与其他先进聚类算法对比,在部分基准数据集上聚类性能有10%以上的提升,同时还从参数敏感性、收敛性、消融实验等方面对算法进行评价。实验结果可以充分显示本文提出的聚类算法的可行性与有效性。 展开更多
关键词 模糊C均值聚类 自适应近邻 算法鲁棒性 迭代算法
在线阅读 下载PDF
上一页 1 2 203 下一页 到第
使用帮助 返回顶部