-
题名多阈值BIRCH聚类算法及其应用
被引量:17
- 1
-
-
作者
邵峰晶
张斌
于忠清
-
机构
青岛大学信息工程学院
青岛大学软件技术研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第12期174-176,195,共4页
-
文摘
BIRCH算法是针对大规模数据集的聚类算法。文章针对该算法在聚类精度和效率方面存在的不足,在原有算法的基础上进行了改进,提出了可变多阈值聚类特征树方法,实现了基于该方法的聚类分析器,最后将该算法应用于图像分割技术当中,验证算法的有效性。
-
关键词
簇
聚类特征
聚类特征树
B+树
条目
-
Keywords
Cluster,Clustering Feature,cf-tree,B+tree,Entry
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于CF树的k-medoids聚类算法
被引量:3
- 2
-
-
作者
曹丹阳
杨炳儒
李广原
刘英华
-
机构
北京科技大学信息工程学院
北方工业大学信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2011年第9期3260-3263,共4页
-
基金
北京市科技计划专项课题
国家自然科学基金资助项目(60875029
+1 种基金
51075423)
北京市属市管高等学校人才强教计划资助项目(PHR20100509)
-
文摘
当存在噪声和离群点时,k-medoids算法具有较好的鲁棒性,但是对于大数据集,算法的计算代价比较高。CF树是Birch算法中常用的一种结构,对于大数据集的聚类有较好的可伸缩性,但是对于非球形的数据,聚类结果较差。因此,在两种算法的基础上,提出一种基于CF树的k-medoids算法,先用数据集构建CF树,形成微簇,改进了欧式距离计算式,最后使用k-medoids算法对微簇进行聚类。当数据点较多时,改进算法比k-medoids算法运行速度快了近2倍。实验表明,改进算法具有较高的性能和可伸缩性。
-
关键词
聚类
K-中心点
CF树
微簇
-
Keywords
clustering
k-medoids
cf-tree
micro-cluster
-
分类号
TP311.138
[自动化与计算机技术—计算机软件与理论]
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于连通距离和连通强度的BIRCH改进算法
被引量:7
- 3
-
-
作者
樊仲欣
王兴
苗春生
-
机构
南京信息工程大学大气与环境实验教学中心
南京信大气象科技有限公司
-
出处
《计算机应用》
CSCD
北大核心
2019年第4期1027-1031,共5页
-
文摘
为解决利用层次方法的平衡迭代规约和聚类(BIRCH)算法聚类结果依赖于数据对象的添加顺序,且对非球状的簇聚类效果不好以及受簇直径阈值的限制每个簇只能包含数量相近的数据对象的问题,提出一种改进的BIRCH算法。该算法用描述数据对象个体间连通性的连通距离和连通强度阈值替代簇直径阈值,还将簇合并的步骤加入到聚类特征树的生成过程中。在自定义及iris、wine、 pendigits数据集上的实验结果表明,该算法比多阈值BIRCH、密度改进BIRCH等现有改进算法的聚类准确率更高,尤其在大数据集上比密度改进BIRCH准确率提高6个百分点,耗时降低61%。说明该算法能够适用于在线实时增量数据,可以识别非球形簇和体积不均匀簇,具有去噪功能,且时间和空间复杂度明显降低。
-
关键词
层次聚类
在线算法
BIRCH
聚类特征
聚类特征树
-
Keywords
hierarchical clustering
on-line algorithm
Balanced Iterative Reducing and Clustering using Hierarchies(BIRCH)
Cluster Feature(CF)
Cluster Feature Tree(CF Tree)
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于密度的改进BIRCH聚类算法
被引量:16
- 4
-
-
作者
韦相
-
机构
红河学院计算机科学与技术系
-
出处
《计算机工程与应用》
CSCD
2013年第10期201-205,共5页
-
基金
云南省教育厅科研基金项目(No.2011C122)
-
文摘
针对传统的BIRCH算法用直径来控制聚类的边界,对非球形聚类效果不佳,甚至会把非球状的簇分割为不同簇这一缺点,对BIRCH算法进行改进,改进算法首先建立多棵CF树,每棵CF树代表一个簇,并结合DBSCAN算法的密度可达的思想。该算法能对任意形状的簇进行准确的聚类。实验表明,算法能通过一次扫描进行有效聚类,时间复杂度与BIRCH算法相同,对大规模数据集具有较高的处理速度,实现了动态聚类,并可以准确地对任意形状的簇进行聚类并发现噪声点。
-
关键词
聚类
CF树
密度
质心
-
Keywords
cluster
cf-trees
density
center of mass
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于DVTD的移动用户出行模式识别研究
被引量:2
- 5
-
-
作者
詹益旺
胡斌杰
-
机构
华南理工大学电子信息学院
广州杰赛科技股份有限公司
-
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第7期72-76,共5页
-
基金
国家发改委移动互联网及第四代移动通信(TD-LTE)产业化专项基金资助项目(发改办高技[2014]2328号)
粤港关键领域重点突破基金资助项目(2011A011305001)
-
文摘
针对移动用户出行模式识别过于复杂的问题,提出一种基于密度与动态阈值的任意形状聚类挖掘算法。利用数据预处理技术提取移动用户在各路段的速度,通过MCFT树构造用户速度分类模型,采用DBSCAN方法进行核心子聚类合并,最终生成MCFT树任意形状的聚类结果,从而达到利用动态速度阈值有效识别用户出行模式的目的。实验结果表明,通过DVTD算法得到动态速度阈值识别用户出行模式具有较高的可行性,提高了用户出行识别的准确性。
-
关键词
DVTD算法
聚类特征树
簇
用户出行模式
动态速度阈值
-
Keywords
DVTD algorithm
Clustering Feature (CF) tree
cluster
user travel pattern
dynamic speed threshold
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于RTAI的Linux系统实时性研究与改进
被引量:10
- 6
-
-
作者
赵旭
夏靖波
-
机构
空军工程大学电讯工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第14期288-290,共3页
-
基金
西安电子科技大学综合业务网理论及关键技术国家重点实验室开放基金资助项目(ISN-9-08)
-
文摘
分析现有嵌入式Linux操作系统实时性的不足,借鉴实时应用接口的结构和完全公平调度算法,提出一种内核进程调度策略,将此调度策略编译进操作系统。系统性能测试表明无论该系统处于忙或闲的状态,改进后的系统都较改进前的系统性能优越,尤其是对于复杂度较高的进程,其性能提升效果更加明显。
-
关键词
调度器
实时应用接口
完全公平调度
红黑树
LINUX内核
-
Keywords
scheduler
Real-time Application Interface(RTAI)
Complete Fair Scheduler(CFS)
red-black tree
Linux kernel
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Web日志挖掘的用户模式识别研究
- 7
-
-
作者
倪曼蒂
覃拥军
-
机构
湖南商务职业技术学院
中兴软件技术有限公司
-
出处
《现代计算机》
2013年第11期14-17,共4页
-
文摘
为提高聚类算法的准确性,通过先对数据集抽样,再对样本数据进行K-means聚类,选出聚类中心,然后为整个数据集中的每个簇单独设置一个阈值的方法对传统的BIRCH算法进行改进。实验表明,在同等条件下,改进后的算法相比传统的BIRCH算法精确度更高,耗时更少。
-
关键词
WEB挖掘
用户模式识别
聚类特征
聚类特征树
-
Keywords
Web Mining
Users Patterns Discovery
Clustering Feature
cf-tree
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于重复热点数据的CF广播结构改进算法
被引量:1
- 8
-
-
作者
孙金津
朱玉全
陈耿
-
机构
江苏大学计算机科学与通信工程学院
南京审计学院信息科学学院
-
出处
《计算机应用研究》
CSCD
北大核心
2010年第12期4698-4700,4704,共4页
-
基金
江苏省"青蓝工程"
江苏省六大人才高峰项目(07-E-025)
+2 种基金
江苏省高校自然科学重大基金研究(08KJA520001)
国家中小企业创新基金资助项目(09C26213203797)
国家自然科学基金资助项目(70971067)
-
文摘
针对现有广播结构构建中对数据访问概率倾斜度考虑不足的问题,在CF索引树的基础上提出了一种基于数据倾斜度的广播构建算法。该算法充分考虑热点数据的请求,根据数据在CF索引树中所处位置的不同,在一个广播周期内重复广播热点数据及其对应的索引节点,尽量减少移动用户的访问时间。最后通过实验验证了改进后广播结构的有效性。
-
关键词
移动计算
数据广播
CF索引树
广播结构
-
Keywords
mobile computing
data broadcast
CF index tree
broadcasting structure
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于本体增量学习的主题爬行
- 9
-
-
作者
王鑫
王英
-
机构
长春工程学院软件职业技术学院
吉林大学计算机科学与技术学院
-
出处
《长春工程学院学报(自然科学版)》
2010年第4期81-85,共5页
-
基金
国家自然科学基金(60973040)
国家教育部高等学校博士学科点专项科研基金(200801830021)
-
文摘
在面向领域的信息搜索中,本体作为相关的领域知识往往有助于改善搜索效果,在信息检索中被广泛应用。基于本体增量学习的主题爬行技术的研究工作主要包括:首先,利用本体对领域概念及关系的描述作为网页主题判定的依据;其次,在爬行过程中,将学习得到的新概念和关系加入到本体中,以丰富完善领域本体,进而提高主题爬虫的收获率;最后,经过大量的实验数据分析,在词条提取准确率、收获率和响应速度等多个指标方面,证明了所提出的方法是可行的并且是高效的。
-
关键词
主题爬虫
本体增量学习
概念树
SF-CF模型
准术语窗口提取模型
-
Keywords
focused crawler
incremental ontology learning
concept tree
SF-CF model
quasi-term window extraction model
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于机器学习的混合式特征选择算法
被引量:7
- 10
-
-
作者
雷海锐
高秀峰
刘辉
-
机构
陆军工程大学石家庄校区装备模拟训练中心
中国人民解放军驻五四一三厂军事代表室
-
出处
《电子测量技术》
2018年第16期42-46,共5页
-
文摘
针对CFS算法中优先选择数量较多的特征属性的问题,引入了信息增益比和对称不确定性的改进CFS算法。同时,为了进一步降低特征维数,提高分类效率,提出一种基于filter-wrapper模型的混合式特征选择方法,先采用改进后的CFS算法过滤无关特征;再基于精简子集,采用封装式选择中的序列后向搜索算法,结合决策树选取最优子集。仿真实验表明,采用该方法选择的特征子集具有更好的分类能力,同时发现该方法在不同的分类模型中泛化能力也有着不同的表现。
-
关键词
特征选择
信息增益比
对称不确定性
CFS
决策树
-
Keywords
feature selection
information gain ratio
symmetrical uncertainly
CFS
decision tree
-
分类号
TN91
[电子电信—通信与信息系统]
-
-
题名基于Linux内核的CFS调度算法研究
被引量:2
- 11
-
-
作者
刘婷
王华军
王光辉
-
机构
成都理工大学信息工程学院
-
出处
《电脑与电信》
2010年第4期61-63,共3页
-
文摘
通过分析Linux2.4和2.6内核调度算法的缺点,介绍了基于公平思想的CFS调度算法的优点。深入分析了CFS算法的思想和核心结构,并研究了CFS算法的调度过程、具体实现的数据结构和细节。
-
关键词
调度算法
LINUX内核
CFS
红黑树
-
Keywords
scheduling algorithm
Linux kernel
CFS
red-black tree
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于公平策略的Linux2.6调度算法与应用分析
- 12
-
-
作者
李建萍
陆建德
-
机构
苏州大学计算机科学与技术学院
-
出处
《微计算机信息》
2010年第33期176-178,71,共4页
-
文摘
传统Linux2.4调度存在诸多缺陷,Linux2.6各版内核先后采用O(1)及CFS调度,大大改进了原来调度中存在的问题,O(1)与CFS调度各有其特点,本文对这些调度器进行深入的剖析与比较,并重点解析CFS调度,笔者对各调度策略的实现过程及适合的应用做了详细的探讨。
-
关键词
O(1)
CFS
公平
优先级调度
红黑树
-
Keywords
O(1)
CFS
fair
priority scheduling
red-black tree
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名特征优选下的全极化雷达影像土地覆盖分类
- 13
-
-
作者
范强
霍畅
张兵
张继超
-
机构
辽宁工程技术大学测绘与地理科学学院
-
出处
《测绘科学》
CSCD
北大核心
2023年第8期102-110,共9页
-
基金
国家自然科学基金项目(42204031)。
-
文摘
针对极化合成孔径雷达(PolSAR)影像在土地覆盖分类中存在特征利用不充分导致分类精度低的问题,该文提出一种联合ReliefF和相关性的特征选择(CFS)算法的分类方法。首先利用ReliefF算法对极化特征进行特征重要性排序,淘汰无关特征,然后利用CFS算法进行特征优选,最后结合分类回归树(CART)决策树构建分类模型,完成土地覆盖分类。以高分三号(GF-3)两个场景的影像数据进行实验,结果表明,该方法能够有效剔除冗余特征,显著提高分类准确率,适用于PolSAR影像土地覆盖分类。
-
关键词
极化合成孔径雷达
特征选择
RELIEFF算法
CFS算法
土地覆盖分类
CART决策树
-
Keywords
polarimetric synthetic aperture radar
feature selection
ReliefF algorithm
CFS algorithm
land cover classification
CART decision tree
-
分类号
P237
[天文地球—摄影测量与遥感]
-