一种改进的k-means聚类视觉词典构造方法被引量：8

Improved k-means clustering method for codebook generation

下载PDF

导出

摘要传统词袋(bag of words,BoW)模型在构造视觉词典时一般采用k-means聚类方法实现,但k-means聚类方法的性能在很大程度上依赖于初始点的选择,从而导致生成的视觉词典鲁棒性较差,此外,每次迭代都要计算数据点与中心点的距离,计算复杂度高。针对上述问题,提出了一种改进的k-means聚类视觉词典构造方法,该方法首先对初始值的选取进行了优化,克服了随机选取初始值对聚类性能的影响,其次基于三角形不等式对计算进行了简化,使生成的视觉词典更加稳定,计算复杂度更低,最后引入权值分布对图像进行基于视觉词典的表示,并将基于改进的视觉词典的词袋模型应用于图像分类,提高了分类性能。通过在Caltech 101和Caltech 256两个数据库进行实验,验证了本文方法的有效性,并分析了词典库大小对分类性能的影响。从实验结果可以看出,采用本文方法所得到的分类正确率提高了5%～8%。 Generally, the k-means clustering method is applied to generate the codebook in bag of word （BoW） model. However, the performance of the k-means clustering method greatly depends on the selection of original centers, which result in less robust codebook. Moreover, the distance between the center point and data point needs to be cal- culated in each iteration, which leads to high calculation complexity. Aiming at this problem, an improved k-means clustering method based on optimized selection of the original center is proposed, which overcomes the influence of randomly selected original center on clustering performance. Triangle inequality is used to simplify the calculation, which makes the generated codebook more robust and makes calculation less complex. At last, a weight contribution based codebook representation method is introduced and the BoW model based on the improved codebook is applied to image categorization, which improves the categorization result. The experiments on Caltech 101 and Caltech 256 databases were carried out, which proves the effectiveness of the proposed method. The effect of codebook size on categorization accuracy is analyzed. The results show that using the proposed method the categorization accuracy is improved by 5% to 8%.

作者赵春晖王莹 Masahide Kaneko

机构地区哈尔滨工程大学信息与通信工程学院日本东京电气通信大学金子研究室

出处《仪器仪表学报》 EI CAS CSCD 北大核心 2012年第10期2380-2386,共7页 Chinese Journal of Scientific Instrument

基金国家自然科学基金(61077079) 教育部博士点计划基金(20102304110013)资助项目

关键词词袋模型视觉词典构造 K-MEANS聚类图像分类 bag of word（Bow） model codebook generation k-means clustering image categorization

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1杨会锋,曹洁,帅立国.基于改进K-均值聚类算法的背景建模方法[J].电子测量与仪器学报,2010,24(12):1114-1118. 被引量：14
2杨春梅,万柏坤,丁北生.数据预处理和初始化方法对K-均值聚类的影响[J].仪器仪表学报,2003,24(z1):189-192. 被引量：4
3BAEK S, YOO C D, YUN S. Learning a discriminative visual codebook using homonym scheme [ C ]. IEE Inter- national Conference on Acoustics, Speech and Signal Pro- cessing. Prague, the Czech Republic, 2011 : 2252-2255.
4BOSCH A, ZISSERMAN A, MUOZ X. Image classifica- tion using random forests and ferns[ C]. IEEE llth In- ternational Conference on Computer Vision. Girona, 2007 : 1-8.
5康家银,纪志成,龚成龙.一种核模糊C均值聚类算法及其应用[J].仪器仪表学报,2010,31(7):1657-1663. 被引量：30
6严华.一种改进的k-means算法[J].计算机与现代化,2009(1):56-59. 被引量：9
7ELKAN C. Using the triangle inequality to accelerate k-means[ C ]. Proceedings of the Twentieth International Conference on Machine Learning. Washington, DC, USA, 2003 : 1-7.
8王安娜,李云路,赵锋云,史成龙.一种新的半监督直推式支持向量机分类算法[J].仪器仪表学报,2011,32(7):1546-1550. 被引量：22
9WANG M Y, ZHANG CH L, YAN S L, Extraction of image semantic features with spatial mean shift clustering algorithm[ C ]. IEEE 10th International Conference on Signal Processing, Beijing, 2010: 906-909.
10康家银.一种改进的顾及像素空间信息的FCM聚类算法[J].仪器仪表学报,2009,30(1):208-212. 被引量：17

二级参考文献79

1张东波,王耀南.FCM聚类算法和粗糙集在医疗图像分割中的应用[J].仪器仪表学报,2006,27(12):1683-1687. 被引量：32
2匡平,朱清新,陈旭东.基于FCM的快速模糊聚类算法研究[J].电子测量与仪器学报,2007,21(2):15-20. 被引量：9
3张治国,刘怀亮,马志辉,张毅,赵娜.基于高层语义的视频检索研究[J].计算机工程与应用,2007,43(18):168-170. 被引量：9
4张晖,董育宁.基于视频的车辆检测算法综述[J].南京邮电大学学报（自然科学版）,2007,27(3):88-94. 被引量：25
5Haken H. Synergetic Computers and Recognition-A Topdown Approach to Neural Nets [ M ]. Berlin: Springer-Verlag, 1991.
6鄂大伟.多媒体基础与应用[M].北京:高等教育出版社,2001.
7Osmar Rachid Zaiane. Resource and Knowledge Discovery from the Internet and Multimedia Repositories [ D ]. Simon Fraser University, 1999.
8Kaufman L, Rousseeuw P J. Finding Groups in Data: An Introduction to Cluster Analysis[ M]. New York: John Wiley & Sons, 1990:23-42.
9陈新泉.k-中心点轮换法及确定合适聚类数目的一种新方法[OL].中国科技论文在线,2006-03-02.
10CHENG H D, JIANG X H, SUN Y, et al. Color image segmentation : advances and prospects [ J ]. Pattern Recognition, 2001, (34) :2259-2281.

共引文献85

1向剑平,唐常杰,陈瑜,胡进军,左劼,易树鸿.基于动力学聚类技术的银行信贷风险挖掘[J].计算机工程与设计,2009,30(14):3478-3480. 被引量：1
2郭庆锐,许建龙,孙树森,何云.基于颜色重心和k-means的彩色图像聚类分割算法[J].浙江理工大学学报（自然科学版）,2010,27(4):580-584. 被引量：7
3康家银,纪志成,龚成龙.一种核模糊C均值聚类算法及其应用[J].仪器仪表学报,2010,31(7):1657-1663. 被引量：30
4王富治,黄大贵.改进的Yoon自适应加权立体匹配算法[J].电子测量与仪器学报,2010,24(7):632-637. 被引量：8
5薄文彦,付文兰,张凤英.聚类算法的改进的研究[J].网络安全技术与应用,2011(6):23-25.
6周锐,胡学钢.基于聚类的决策树连续属性离散化改进算法[J].微计算机信息,2011,27(6):183-184. 被引量：1
7庞宇,霍修坤,潘丽丽,方荣富.一种改进的FCM算法在脑出血图像中的应用[J].电子技术（上海）,2011,38(6):45-47. 被引量：1
8陈锟,刘金清.结合分水岭算法和WKFCM算法的MRI图像分割[J].电子测量与仪器学报,2011,25(6):516-521. 被引量：10
9刘小芳,何彬彬.近邻样本密度和隶属度加权FCM算法的遥感图像分类方法[J].仪器仪表学报,2011,32(10):2242-2247. 被引量：12
10张琳,陈燕,汲业,张金松.一种基于密度的K-means算法研究[J].计算机应用研究,2011,28(11):4071-4073. 被引量：44

同被引文献86

1任喜伟,任工昌,杨帆.电磁场式油水界面测量分析及数据优化方法[J].化工自动化及仪表,2012,39(7):858-861. 被引量：8
2付鹏,王宁玲,杨勇平,杨志平.多变边界火电机组能耗基准状态表征方法[J].工程热物理学报,2015,36(3):468-473. 被引量：7
3张铫,王宝光,刘力双,李亚标.基于电容传感器的熔融金属液位检测系统[J].传感技术学报,2006,19(4):1049-1051. 被引量：3
4洪军,崔彦锋,毕小龙,司风琪,徐治皋.机组在线运行优化系统及实时目标工况的确定[J].电力系统自动化,2007,31(6):86-90. 被引量：15
5WANG X, WANG S. Collaborative signal processing for target tracking in distributed wireless sensor networks[J]. Journal of Parallel and Distributed Computing, 2007, 67(5) 501-515.
6ZHENG S, XIE B, HUANG K, et al. Multi-view pede- strian recognition using shared dictionary learning with group sparsity [C]. Proceedings of the 18th International Conference on Neural Information Processing (ICONIP), 2011 : 629-638.
7AKYILDIZ I F, MELODIA T, CHOWDHURY K R. A survey on wireless multimedia sensor networks [J]. Com- puter networks, 2007, 51 (4): 921-960.
8YANG A Y, MAJI S, HONG K, et al. Distributed com-pression and fusion of nonnegative sparse signals for mul- tiple-view object recognition [C]. Information Fusion, 2009. FUSION'09. 12th International Conference on. IEEE, 2009: 1867-1874.
9TAUBMAN D S, MARCELLIN M W, RABBANI M. JPEG2000: Image compression fundamentals, standards and practice [J]. Journal of Electronic Imaging, 2002, 11(2): 286-287.
10SORO S, HEINZELMAN W. A survey of visual sensor networks [J]. Advances in Multimedia, 2009: 1-21.

引证文献8

1谈宇奇,王雪,林奎成.基于视觉压缩感知的传感网络行人目标辨识方法[J].仪器仪表学报,2014,35(11):2433-2439. 被引量：5
2李百寿,陈婷,高玉久.基于混合光谱特征的建筑物高分影像分类样本筛选[J].桂林理工大学学报,2014,34(4):704-710. 被引量：2
3黄婷,赵自明,李翠华.基于纹元森林的视觉词袋模型在图像分类中的应用[J].厦门大学学报（自然科学版）,2015,54(1):99-106.
4张宇献,彭辉灯,王建辉.基于异构值差度量的SOM混合属性数据聚类算法[J].仪器仪表学报,2016,37(11):2555-2562. 被引量：5
5金铭,汪友生,边航,王雨婷.一种基于视觉词袋模型的图像检索方法[J].计算机应用与软件,2017,34(4):249-254. 被引量：3
6田文利.基于霍夫直线检测与二维透视变换的图像校正恢复算法[J].电子测量技术,2017,40(9):128-131. 被引量：18
7任喜伟,何立风,姚斌,宋安玲.用于油水界面测量的中值预处理聚类算法[J].电子测量与仪器学报,2018,32(10):161-168. 被引量：3
8王仲,顾煜炯,韩旭东,杨建球,黄元平.基于历史数据聚类的火电机组工况划分[J].仪器仪表学报,2019,40(2):90-95. 被引量：13

二级引证文献49

1游伟,王雪.人行为骨架特征识别边缘计算方法研究[J].仪器仪表学报,2020(10):156-164. 被引量：9
2蔡挺,徐海龙,张晓梅,李骁,李晓楠."刑侦痕迹图像复原及鉴定系统"应用研究[J].中国公共安全,2023(2):84-87.
3刘智皓,林盛鑫,庄泽杰.基于嵌入式Linux系统的条码识别器的设计与实现[J].东莞理工学院学报,2019,26(1):6-10.
4周威,王博,潘伟涛.祖冲之算法硬件实现与研究[J].国外电子测量技术,2015,34(7):66-71. 被引量：5
5张爱玲.融合激光扫描强度和遥感信息的建筑物分类研究[J].激光杂志,2016,37(1):22-25. 被引量：3
6谢宏,张爱林,陈海滨,张小刚,陈俊辉,李云峰,向启均.改进WMIL的实时人脸检测与跟踪[J].电子测量与仪器学报,2016,30(3):465-472.
7郭宾,张冰尘.基于CAMP稀疏重建算法的并行实现[J].国外电子测量技术,2016,35(5):24-28. 被引量：5
8白中浩,王鹏辉,李智强.基于Stixel-world及特征融合的双目立体视觉行人检测[J].仪器仪表学报,2017,38(11):2822-2829. 被引量：6
9李立莉.大数据环境下图书碎片化信息精确整合仿真[J].计算机仿真,2018,35(9):413-416. 被引量：2
10袁帅,郭艳茹,宫巍,韩笑迎,闫雪.基于DSmT的室内环境轮廓超声检测模型研究[J].仪器仪表学报,2018,39(10):142-149. 被引量：7

1任远,巢文涵,周庆,李舟军.基于话题自适应的中文微博情感分析[J].计算机科学,2013,40(11):231-235. 被引量：10
2王美华,曾燕妮,蔡瑞初.改进K-Means聚类算法及其在视觉词典构造中的应用[J].计算机应用与软件,2015,32(10):159-163. 被引量：4
3徐望明,郑超兵.基于聚类分析的无监督视觉词典构造方法研究[J].微电子学与计算机,2016,33(3):152-156.
4邹涛,王继成,黄源,张福炎.中文文档自动分类系统的设计与实现[J].中文信息学报,1999,13(3):26-32. 被引量：45
5许华.中文分词系统设计之词典构造[J].科技创新导报,2010,7(20):230-230.
6杨晓敏,严斌宇,李康丽,苏冰山.基于金字塔模型的图像分类[J].计算机与数字工程,2015,43(4):704-706.
7华骅,杨晓敏,严斌宇.基于视觉显著度及金字塔模型的图像分类[J].数字技术与应用,2015,33(3):51-53.
8孙孟柯,张红梅.基于Bag of words模型的图像检索系统的设计与实现[J].电脑知识与技术（过刊）,2012,18(2X):1139-1141. 被引量：1
9火善栋.有限状态机在中文文本分词中的应用[J].现代计算机,2010,16(6):30-33. 被引量：1
10苗京,李圆媛,佘幼宇.应用数据词典构造基于Web结构的数据库中间件[J].计算机系统应用,2004,13(9):60-62. 被引量：1

仪器仪表学报

2012年第10期

浏览历史

内容加载中请稍等...

一种改进的k-means聚类视觉词典构造方法被引量：8

参考文献12

二级参考文献79

共引文献85

同被引文献86

引证文献8

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

一种改进的k-means聚类视觉词典构造方法 被引量：8

参考文献12

二级参考文献79

共引文献85

同被引文献86

引证文献8

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

一种改进的k-means聚类视觉词典构造方法被引量：8