中文微博情感分类的简单多标签排序算法被引量：3

Simple multi-label ranking for Chinese microblog sentiment classification

下载PDF

导出

摘要针对中文微博文本情感分类中每个样本最多只有两种有序情感标签的情形,提出了一种简单的多标签排序算法——TSMLR,该算法采用两步学习和两步分类的策略,通过学习情感标签之间的主次关系,对微博文本的情感进行分类并对情感标签进行排序。首先,将一个多标签排序问题转化为八个多类单标签分类问题,分别对主要情感标签和次要情感标签进行学习;然后,利用得到的分类模型对微博表达的情感进行两步分类,首先给出主要情感标签,再给出次要情感标签。通过在NLP&CC2014的中文微博文本情感分析评测数据集上进行实验,与校准标签排序方法(CLR)相比,TSMLR方法的准确度和平均精度分别提高了8.59%和9.28%,1-错误率相应下降了9.77%,而且TSMLR所需的训练时间相对较少。实验结果表明:TSMLR对标签之间顺序关系的学习能够有效提高对中文微博情感分类的准确率。 In order to solve a specific case that each sample has two emotional labels at most in emotion classification of Chinese microblog text, a simple multi-label ranking algorithm named TSMLR was proposed. The proposed algorithm employed the strategy of two-stage learning and two-stage classification, and gave classification and ranking emotional labels for each mieroblog text by learning the relations between labels. Firstly, it transformed the emotion classification problem into eight single-label classification problems. One learning model was trained for the dominant emotion and seven learning models were trained for the secondary emotion. It classified for the dominant emotion label at first, then chose the corresponding classification model for the secondary emotion label. The experiment was conducted on the dataset of Chinese Weibo Texts provided by NLP＆CC2014. The results showed that the proposed method improved the accuracy and average precision by 8.59% and 9.28% respectively, and decreased the one-error by 9.77% accordingly, compared to the method of Calibrated Label Ranking （CLR）. In addition, the running time of the proposed method was lower than those of the two baseline methods. These experimental results illustrate that the proposed algorithm can effectively learn the label order and make more accurate emotion classification for Chinese microblog.

作者史绍亮文益民缪裕青

机构地区桂林电子科技大学计算机科学与工程学院广西可信软件重点实验室(桂林电子科技大学)

出处《计算机应用》 CSCD 北大核心 2015年第10期2721-2726,共6页 journal of Computer Applications

基金国家自然科学基金资助项目(61363029 71340025) 广西区科学研究与技术开发项目(桂科攻14124005-2-1) 广西可信软件重点实验室项目(KX201311)

关键词情感分析中文微博多标签排序情感分类两步策略 sentiment analysis Chinese microblog multi-label ranking emotion classification two-stage strategy

分类号 TP391.4 [自动化与计算机技术—计算机应用技术] TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献25

1赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：551
2周胜臣,瞿文婷,石英子,施询之,孙韵辰.中文微博情感分析研究综述[J].计算机应用与软件,2013,30(3):161-164. 被引量：81
3贺飞艳,何炎祥,刘楠,刘健博,彭敏.面向微博短文本的细粒度情感特征抽取方法[J].北京大学学报（自然科学版）,2014,50(1):48-54. 被引量：29
4欧阳纯萍,阳小华,雷龙艳,徐强,余颖,刘志明.多策略中文微博细粒度情绪分析研究[J].北京大学学报（自然科学版）,2014,50(1):67-72. 被引量：23
5LIU S, CHEN J. A multi-label classification based approach for sen- timent classification [ J]. Expert Systems with Applications, 2015, 42(3) : 1083 - 1093.
6YANG J, JIANG L, WANG C, et al. Multi-label emotion classifi- cation for tweets in weibo: method and application [ C]// ICTAI: Proceedings of the 2014 IEEE 26th International Conference on Tools with Artificial Intelligence. Piscataway: IEEE Press, 2014: 424 - 428.
7WANG M, LIU M, FENG S, et al. A novel calibrated label ranking based method for multiple emotions detection in Chinese microhlogs [ C]// NLPCC 2014: Proceedings of the Third CCF Conference on Natural Language Processing and Chinese Computing, CCIS 496. Berlin: Springer-Verlag, 2014:238-250.
8CUI A, ZHANG H, LIU Y, et al. Lexicon-based sentiment analysis on topical Chinese microblog messages [ M]// LI J, QI G, ZHAO D, et al. Semantic Web and Web Science. Berlin: Springer-Ver- lag, 2013:333-344.
9张珊,于留宝,胡长军.基于表情图片与情感词的中文微博情感分析[J].计算机科学,2012,39(S3):146-148. 被引量：55
10SHEN Y, LI S, ZHENG L, et al. Emotion mining research on mi- cro-blog [ C]// SWS 2009: Proceedings of the 1st 1EEE Symposi-um on Web Society. Piscataway: 1EEE Press, 2009:71 -75.

二级参考文献139

1张珊,于留宝,胡长军.基于表情图片与情感词的中文微博情感分析[J].计算机科学,2012,39(S3):146-148. 被引量：55
2朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：327
3苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：391
4M.Q. Hu, B. Liu. Mining and Summarizing Custom- er Reviews[C]//ACM SIGKDD 2004.. 168-177.
5Bo Pang, Lillian Lee. Opinion mining and sentiment a- nalysis[C]//Foundations and Trends in Information Retrieval, 2(1-2):1-135.
6M.Q. Hu, B. Liu. Opinion Extraction and Summari- zation on the Web[C]//AAAI06, Boston: 1621-1624.
7H. Yu, V. Hatzivassiloglou. Towards Answering O- pinion Question: Separating Facts from Opinions and Identifying the Polarity of Opinion Sentences[C]// EMNLP'03 : 129-136.
8Bo Pang, Lillian Lee, Shivakumar Vaithyanathan. Thumbs up? sentiment classification using machine learning techniques[C]//ACL'02: 79-86.
9Bo Pang, Lillian Lee. A sentimental education: Senti- ment analysis using subjectivity summarization based on minimum cuts[C]//ACL'04: 271-278.
10E. Riloff, J. Wiebe. 2003. Learning extraction pat-terns for subjective expressions[C]//EMNLP'03: 105- 112.

共引文献930

1李芮涵,王立明,王昌燕.民俗文化类景区投射形象与感知形象对比分析——以喀什古城景区为例[J].特区经济,2023(9):156-160.
2王曰芬,吴鹏,丁晟春,陈芬.社会舆情分析研究与进展综述[J].情报学进展,2016(1):132-185. 被引量：1
3包乾辉,李佳利,石淑珍,戴引,刘雪.基于DSLML的鸡蛋消费在线评论情感分析[J].农业机械学报,2021,52(S01):496-503. 被引量：6
4王弘睿,刘畅,于东.面向人工智能伦理计算的中文道德词典构建方法研究[J].中文信息学报,2021,35(10):39-47. 被引量：3
5王昭雨,庄惟敏.情感语义视角:街区更新后评估方法应用研究[J].建筑学报,2020(S02):105-109. 被引量：21
6刘栋,张彩环.情境特征及其在情感分类模型中的应用[J].计算机应用研究,2020,37(1):144-147.
7徐晖,王中卿,李寿山,张民.结合情感信息的个性化对话生成[J].计算机科学,2022,49(S02):99-104. 被引量：3
8张良波,任际范,周晶晶,吴欣宇.电商直播中弹幕互动特征对销售效率的影响[J].管理科学,2023,36(4):17-29. 被引量：5
9安颖,葛格.基于平行语料库的英汉电商评价对比研究[J].汉字文化,2022(23):113-115.
10蔡馥谣.抖音短视频中辽宁城市形象的呈现与传播策略研究[J].都市文化研究,2024(1):230-242.

同被引文献26

1李蕾,王冕,章成志.区分标签类型的社会化标签质量测评研究[J].图书情报工作,2013,57(23):11-16. 被引量：17
2吴小兰,章成志.结合用户关系网和标签共现网的微博用户标签推荐研究[J].情报学报,2015,34(5):459-465. 被引量：9
3付忠良,张丹普,王莉莉.多标签AdaBoost算法的改进算法[J].四川大学学报（工程科学版）,2015,47(5):103-109. 被引量：6
4阮光册,夏磊.互联网推荐系统研究综述[J].情报学报,2015,34(9):999-1008. 被引量：18
5滕广青,杨明秋,田依林,黄微.Folksonomy模式中的知识群落及其核心知识分析[J].图书情报工作,2015,59(22):124-129. 被引量：11
6徐芸芝,邵曦.基于MT-LDA的音乐标签主题检索[J].计算机技术与发展,2016,26(7):200-204. 被引量：1
7林康,杨云,秦怡,闵玉涓.结合用户属性聚类的协同过滤推荐算法[J].计算机与现代化,2016(7):28-32. 被引量：3
8熊回香,杨雪萍.社会化标注系统中的个性化信息推荐研究[J].情报学报,2016,35(5):549-560. 被引量：18
9赵文涛,王春春,成亚飞,孟令军,赵好好.基于用户多属性与兴趣的协同过滤算法[J].计算机应用研究,2016,33(12):3630-3633. 被引量：14
10宋灵超,黄崑.基于社会标签的图像情感分类标注研究[J].图书情报工作,2016,60(21):103-112. 被引量：8

引证文献3

1李德玉,罗锋,王素格.融合CNN和标签特征的中文文本情绪多标签分类[J].山西大学学报（自然科学版）,2020,43(1):65-71. 被引量：8
2马晓悦,马昊.考虑标签情绪信息的图书资源个性化推荐方法研究[J].情报理论与实践,2020,43(9):115-124. 被引量：11
3陈玮,林雪健,尹钟.基于神经网络融合标签相关性的多标签情感预测研究[J].中文信息学报,2021,35(1):104-112. 被引量：8

二级引证文献26

1程艳,朱海,项国雄,唐天伟,钟林辉,王国玮.融合CNN和EWC算法的不平衡文本情绪分类方法[J].中文信息学报,2020(4):92-100. 被引量：6
2马晓悦,马昊.考虑标签情绪信息的图书资源个性化推荐方法研究[J].情报理论与实践,2020,43(9):115-124. 被引量：11
3刘娇,李艳玲,林民.胶囊网络用于短文本多意图识别的研究[J].计算机科学与探索,2020,14(10):1735-1743. 被引量：9
4张德政,范欣欣,谢永红,蒋彦钊.基于ALBERT与双向GRU的中医脏腑定位模型[J].工程科学学报,2021,43(9):1182-1189. 被引量：7
5蒲松,黄河,张翔,黄浩鹏,于连栋.基于直线方程的测量机软件标签自动排布方法[J].工具技术,2021,55(11):112-115.
6王浩.基于深度学习的情感分析系统设计[J].信息与电脑,2021,33(19):80-82.
7彭玉芳,石进,徐浩,杨海平.基于BERT和分面分类的多标签的南海证据性数据分类研究[J].图书馆杂志,2022,41(5):102-108. 被引量：6
8王秀慧,赵治军.基于用户偏好行为数据的数字图书馆资源推荐方法研究[J].软件,2022,43(5):8-12. 被引量：3
9王金威.基于大数据分析的高校云招聘信息个性化推送研究[J].安徽电子信息职业技术学院学报,2022,21(4):25-31. 被引量：2
10张霞,赵东,陶思翰.一种基于卷积神经网络的下肢动作模式识别方法[J].河北科技大学学报,2022,43(4):347-354. 被引量：3

1何泉昊,樊兴华,周鹏.基于两步策略的文本分类方法实验研究[J].广西师范大学学报（自然科学版）,2011,29(4):35-38.
2李旻先,赵春霞,唐金辉,侯迎坤.基于视觉显著性近邻投票的标签排序方法[J].南京理工大学学报,2012,36(4):561-566. 被引量：2
3曾子林.一种面向标签排序数据集的特征选择方法[J].计算机应用研究,2017,34(4):1036-1041. 被引量：1
4陈建林,樊兴华,王国胤.基于两步策略的英文文本分类[J].广西师范大学学报（自然科学版）,2007,25(4):200-203. 被引量：1
5朱松豪,邹黎明.一种改进图像标注的新方法[J].南京邮电大学学报（自然科学版）,2013,33(3):56-60. 被引量：1
6吴焰樟,刘宏哲,冯松鹤,袁家政,张静怡.互联网社群图像标签排序研究进展[J].计算机科学,2015,42(8):22-27.
7Sailor.本本情报站[J].微型计算机,2003(18):68-68.
8sailor.本本情报站[J].微型计算机,2003(22):51-51.
9本本情报站[J].微型计算机,2003(12):58-59.
10sailor.本本情报站[J].微型计算机,2003(21):57-57.

计算机应用

2015年第10期

浏览历史

内容加载中请稍等...

中文微博情感分类的简单多标签排序算法被引量：3

参考文献25

二级参考文献139

共引文献930

同被引文献26

引证文献3

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

中文微博情感分类的简单多标签排序算法 被引量：3

参考文献25

二级参考文献139

共引文献930

同被引文献26

引证文献3

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

中文微博情感分类的简单多标签排序算法被引量：3