基于kNN的多标签分类预处理方法被引量：5

Pre-processing Method of Multi-label Classification Based on kNN

下载PDF

导出

摘要多标签学习已成为当前机器学习的研究热点。为了提高分类性能,对训练集中的噪声数据进行预处理,提出一种基于k近邻(kNN)的多标签分类去噪方法:对现有的多标签数据集进行分析后获得近似正态分布的特征,通过将噪声标记改为其k近邻标记的方法,滤去部分噪声信息,从而得到相对高质量的数据集。在MULAN平台上使用多个数据集对6种多标签分类算法进行了噪声去除前后的对比测试,实验结果表明,多标签的预处理方法有效提高了分类器的性能。此方法对于分布特征明显的数据集具有较好的适用性。 Multi-label learning is a new field in machine learning. In order to improve the multi-label classification precision, a new kNN method was used to remove the noise labels. First, a normal distribution is discovered by analyzing the characteristics of multi-label datasets, and then the high quality datasets are generated by changing the value of noisy labels to their k-Nearest Neighbors. In the experiments, six kinds of multi-label classification methods were tested on MULAN with new datasets. Compared to the primal datasets, the classification precision based on new datasets is better. Research results show this method is suitable for the data set which has a regular distribution.

作者徐晓丹姚明海刘华文郑忠龙

机构地区浙江工业大学信息工程学院浙江师范大学数理与信息工程学院

出处《计算机科学》 CSCD 北大核心 2015年第5期106-108,131,共4页 Computer Science

基金浙江省教育厅项目(Y201328291) 浙江省自然科学基金项目(LZ14F030001 LY14F020012)资助

关键词多标签分类正态分布预处理 KNN Multi-label, Classification, Normal distribution, Pretreatment, kNN

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献19

1Zhang Min-ling,Zhou Zhi-hua.ML-KNN:A lazy learning ap-proach to multi-label learning [J].Pattern Recognition,2007,7(40):2038-2048.
2Tsoumakas G,Katakis I,Vlahavas I.Mining multi-label data[M]∥Data Mining and Knowledge Discovery Handbook.New York:Springer US,2010.
3Xu Xin-shun,Jiang Yuan,Peng Liang,et al.Ensemble approach based on conditional random field for multi-labels image and video annotation[C]∥Proceedings of the 19th ACM international conference on Multimedia.Scottsdale,Arizona,USA,2011:1377-1380.
4Wang Jing-dong,Zhao Ying-hai,Wu Xiu-qing,et al.A transductive multi-label learning approach for video concept detection [J].Pattern Recognition,2011,44(10/11):2274-2286.
5Sanden C,Zhang J Z.Enhancing multi-label music genre techniques [C]∥Proceedings of the 34th International ACM SIGIR Conference on Research and Development in information Retrieval(SIGIR'11).New York,USA,2011:705-714.
6Wieczorkowska A,Synak P,Ras Z.Multi-label classification of emotions in music[C]∥Proceeding of the 2006 International Conference on Intelligent Information Proceeding and Web Mi-ning(IIPWM).2006:307-315.
7Trohidis K,Tsoumakas G,Kalliris G,et al.Multi label classification of music into emotions[C]∥Proceeding of 9th International Conference on Music Information Retrieval(ISMIR).Philadelphia,PA,USA,2008:69-75.
8Zhang Yi,Burer S,Street W N.Ensemble pruning via semi-definite programming [J].Journal of Machine Learning Research,2006(7):1315-1338.
9Read J,Pfahringer B,Holmes G,et al.Classifier Chains forMulti-label Classification[J].Machine Learning,2011,85(3):333-359.
10Shen X,Boutell M,Luo J,et al.Multi-label machine learning and its application to semantic scene classification[C]∥Proceedings of the 2004 International Symposium on Electronic Imaging.San Jose,California,USA,2004:18-22.

同被引文献39

1王永刚,杨杰,周越,王忆勤.中医舌象颜色识别的研究[J].生物医学工程学杂志,2005,22(6):1116-1120. 被引量：32
2杨朝辉,张大鹏,李乃民.裂纹舌图像的核假彩色变换及其纹线提取[J].计算机辅助设计与图形学学报,2010,22(5):771-776. 被引量：7
3费玉坤,赵一祥.动车组转向架三级检修[J].机车车辆工艺,2011(4):45-46. 被引量：5
4闫永刚,马廷淮,王建.KNN分类算法的MapReduce并行化实现[J].南京航空航天大学学报,2013,45(4):550-555. 被引量：21
5李珩,张朝亮.基于K邻近算法的LocalLDtree分类模型分析[J].硅谷,2013,6(23):33-33. 被引量：1
6马宗杰,刘华文.基于奇异值分解—偏最小二乘回归的多标签分类算法[J].计算机应用,2014,34(7):2058-2060. 被引量：5
7王霄,周李威,陈耿,朱玉全.一种基于标签相关性的多标签分类算法[J].计算机应用研究,2014,31(9):2609-2612. 被引量：9
8朱穆朗玛,陆萍,夏春明,王忆勤.基于道格拉斯-普克法提取55例齿痕舌图像特征研究[J].中华中医药学刊,2014,32(9):2138-2140. 被引量：10
9张成,李秀玉,逄玉俊,李元.基于GMM的马氏距离kNN故障检测方法研究[J].测控技术,2014,33(9):13-17. 被引量：14
10李远航,刘波,唐侨.面向多标签图数据的主动学习[J].计算机科学,2014,41(11):260-264. 被引量：1

引证文献5

1张丽娜,戴灵鹏,匡泰.一种适应于非完备标签数据和标签关联性的多标签分类方法[J].电信科学,2016,32(8):82-89.
2石艳敏,张守宾,朱习军.基于Hadoop的中医症状群分类应用[J].计算机应用与软件,2018,35(7):325-328.
3汤一平,王丽冉,何霞,陈朋,袁公萍.基于多任务卷积神经网络的舌象分类研究[J].计算机科学,2018,45(12):255-261. 被引量：14
4邱英,冯春雨,谢锋云,刘昆,杨静,王二化.基于K邻近算法的转向架构架状态识别研究[J].测控技术,2019,38(8):48-53. 被引量：4
5王盼红,朱昌明.融合CNN与交互特征的多标签图像分类方法[J].计算机与现代化,2022(9):85-92. 被引量：3

二级引证文献21

1王一丁,孙常浩,崔家礼,武小荣,秦雨欣.基于深度学习的舌裂分割算法研究[J].世界科学技术-中医药现代化,2021,23(9):3065-3073. 被引量：7
2刘锦妹.会计工作滞后对乡镇企业发展的影响及对策[J].农业经济问题,2000,21(5):55-57. 被引量：1
3宋晓宾,李奕,李冬,任健,李修阳,马柯.Alexnet卷积神经网络辨识幽门螺杆菌阳性舌象的可行性研究[J].山东中医杂志,2021,40(3):235-238. 被引量：3
4吴英建,王景霖,刘贞报.基于多尺度模糊熵的齿轮故障诊断方法[J].测控技术,2021,40(3):19-23. 被引量：11
5王勇.基于颜色聚类识别苔色的三重注意力网络[J].电子技术与软件工程,2021(4):133-136. 被引量：1
6张丽倩,李孟航,高珊珊,张彩明.面向计算机辅助舌诊关键问题的解决方案综述[J].计算机科学,2021,48(7):256-269. 被引量：7
7陈宇,周悟,胡月明,谢健文.耕地质量评价缺失数据填充方法研究[J].农业资源与环境学报,2021,38(6):1132-1141. 被引量：6
8江智泉,周作建,鲍剑洋,战丽彬,商洪涛.人工智能背景下的中医舌诊客观化研究概述[J].计算机时代,2022(1):1-4. 被引量：15
9徐雍钦,杨晶东,姜泉,韩曼,宋梦歌.基于多特征融合的中医症候舌象分类方法研究[J].智能计算机与应用,2022,12(7):25-34. 被引量：3
10吴欣,徐红,林卓胜,李胜可,刘慧琳,冯跃.深度学习在舌象分类中的研究综述[J].计算机科学与探索,2023,17(2):303-323. 被引量：10

1胡学钢,许尧,李培培,张玉红.一种过滤式多标签特征选择算法[J].南京大学学报（自然科学版）,2015,51(4):723-730. 被引量：8
2李志春,娄静.应用Excel做二项分布及其近似正态分布的电脑实验[J].数理医药学杂志,2003,16(2):168-169. 被引量：5
3张振海,李士宁,李志刚,陈昊.一类基于信息熵的多标签特征选择算法[J].计算机研究与发展,2013,50(6):1177-1184. 被引量：62
4付达杰,戴红红.一种基于正态分布的数据流挖掘决策树算法[J].计算机应用与软件,2014,31(8):285-287.
5陈爽,李先国,陈福,李素.一种抽取新闻网页结构化数据的方法[J].燕山大学学报,2007,31(6):485-488. 被引量：1
6曾琳,张庆远,杨显国.应用Excel做二项分布及其近似正态分布的电脑演示[J].内江科技,2008,29(1):176-176. 被引量：1
7郑文博,杨燕,王洪军.基于模糊支持向量的多标签分类方法[J].广西大学学报（自然科学版）,2011,36(5):758-763. 被引量：1
8兰浩良,朱玉全,陈耿.一种新的多标签数据集转换方法RAPC-W[J].计算机应用研究,2013,30(6):1692-1695.
9曾琳.二项分布教学中的Excel演示[J].信息与电脑（理论版）,2013(10):182-183.
10胡瑜,王立志.基于HTML结构特征的网页信息提取[J].辽宁石油化工大学学报,2009,29(3):65-69. 被引量：5

计算机科学

2015年第5期

浏览历史

内容加载中请稍等...

基于kNN的多标签分类预处理方法被引量：5

参考文献19

同被引文献39

引证文献5

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于kNN的多标签分类预处理方法 被引量：5

参考文献19

同被引文献39

引证文献5

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于kNN的多标签分类预处理方法被引量：5