融合内容相似度与多特征计算的个性化微博推荐模型被引量：5

Personalized Microblog Recommendation Model Integrating Content Similarity and Multi-feature Computing

下载PDF

导出

摘要微博的流行导致信息过载等问题日益突出,如何帮助用户快速而准确地找到需要的微博已成为亟待解决的问题。基于协同过滤技术和基于LDA的微博推荐虽然能够达到一定的准确性,但并不能解决内容分类过于笼统及使用LDA模型处理短文本存在弊端的问题。为此,文中提出了一种融合内容相似度与多特征计算的个性化微博推荐模型。首先,从微博内容语义出发,基于word2vec技术计算得到用户与微博的内容相似度;然后,根据微博的时间、点赞数、评论数和转发数等特征,计算微博的保鲜度及受欢迎度;最后,综合考虑微博的内容相似度、保鲜度和受欢迎度,计算微博排序评分,从而实现用户的个性化微博推荐。该模型根据内容相似度进行推荐,从而避免了上述问题,也使得推荐结果在语义上更为精确。实验结果表明,所提推荐模型在准确率、召回率和F值上均具有良好的表现,尤其在准确率方面有明显的提升效果,约提升了10%,F值也提升了约5%,从而证明了该模型的有效性。 With the popularity of microblog,problems such as information overload are increasingly prominent.How to help users find the microblog they need quickly and accurately has become an urgent problem to be solved.Although microblog recommendation based on collaborative filtering technology and LDA can achieve certain accuracy,it can not solve the problems of genernal classification of content and the disadvantages when LDA model is used to deal with short texts.Therefore,this paper proposes a personalized microblog recommendation model integrating content similarity and multi-feature computing.Firstly,the content similarity between user and microblog is calculated based on word2vec.Then,according to the characteristics such as time,number of likes,comments and reposts,the freshness and popularity of microblog are calculated.Finally,the content similarity,freshness and popularity of microblog are comprehensively considered to calculate its ranking score,so as to realize users’personalized microblog recommendation.This model considers recommendation from the perspective of content similarity,avoiding the above problems and making the recommendation results more accurate in semantics.Experimental results show that the proposed model has good performance in accuracy,recall rate and F-measure,in particular,the accuracy has been significantly improved by about 10%,and F-Measure is increased by about 5%,and the validity of the model is proved.

作者刘宇东孙豪蒋运承 LIU Yu-dong;SUN Hao;JIANG Yun-cheng(School of Computer Science,South China Normal University,Guangzhou 510631,China)

机构地区华南师范大学计算机学院

出处《计算机科学》 CSCD 北大核心 2020年第10期97-101,共5页 Computer Science

基金国家自然科学基金面上项目(61772210) 广州市科技计划项目(201807010043)。

关键词微博 word2vec 相似度保鲜度受欢迎度 Mircroblog word2vec Similarity Freshness Popularity

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1安悦,李兵,杨瑞泰,胡沥丹.基于内容的热门微话题个性化推荐研究[J].情报杂志,2014,33(2):155-160. 被引量：28
2王梦佳,贺智明,郑剑.结合信任和用户关系的微博关注推荐算法[J].计算机应用研究,2018,35(12):3560-3563. 被引量：3
3郭磊,马军,陈竹敏,姜浩然.一种结合推荐对象间关联关系的社会化推荐算法[J].计算机学报,2014,37(1):219-228. 被引量：73
4唐晓波,梁梦婕.融合结构与内容特征的微博沉默用户兴趣模型构建研究[J].情报学报,2015,34(11):1214-1224. 被引量：7
5唐明,朱磊,邹显春.基于Word2Vec的一种文档向量表示[J].计算机科学,2016,43(6):214-217. 被引量：146
6齐超,陈鸿昶,于洪涛.基于用户行为综合分析的微博用户影响力评价方法[J].计算机应用研究,2014,31(7):2004-2007. 被引量：32
7王玙,高琳.基于社交圈的在线社交网络朋友推荐算法[J].计算机学报,2014,37(4):801-808. 被引量：53
8段旭磊,张仰森,孙祎卓.微博文本的句向量表示及相似度计算方法研究[J].计算机工程,2017,34(5):143-148. 被引量：21

二级参考文献126

1徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100. 被引量：124
2刘军.整体网分析讲义[M].上海:格致出版社,2009.
3化柏林.知识抽取中的停用词处理技术[J].现代图书情报技术,2007(8):48-51. 被引量：39
4互动百科:僵尸粉[EB/OL].[2012-02-10].http://www.hudong.eom/wiki/%E5%83%B5%E5%B0%B8%E7%B2%89.
5第31次中国互联网络发展状况统计报告[R].中国互联网络信息中心(CNNIC),2013,1.
6Ma H, King I, Lyu M. Learning to recommend with social trust ensemble/ /Proceedings of the 32nd International ACM SIGIR Conference on Research and Development in Information Retrieval. Boston, USA, 2009: 203-210.
7Ma H, Zhou D, Liu C, et al. Recommender systems with social regularization/ /Proceedings of the 4th ACM International Conference on Web Search and Data Mining. Hong Kong, China, 2011: 287-296.
8Jamali M, Ester M. A matrix factorization technique with trust propagation for recommendation in social networks/ / Proceedings of the 4th ACM Conference on Recommender Systems. Barcelona, Spain, 2010: 135-142.
9Bell R, Koren Y, Volin sky C. Modeling relationships at multiple scales to improve accuracy of large recommender systems/ /Proceedings of the 13th ACM SIGKDD Internationa I Conference on Knowledge Discovery and Data Mining. San Jose. USA. 2007: 95-104.
10Onuma K. Tong H. Faloutsos C. Tangent: A novel'. surprise me'. recommendation algorithm/ /Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Paris. France, 2009: 657-666.

共引文献351

1薛永龙,汝倩倩.遮蔽与解蔽:算法推荐场域中的意识形态危局[J].自然辩证法研究,2020,0(1):50-55. 被引量：41
2司长强,种法彤.竞演类综艺《我就是演员》的微博传播策略[J].新闻传播,2022(14):23-25.
3黄贤英,阳安志,刘小洋,刘广峰.融合兴趣的微博用户相似度计算研究[J].计算机应用研究,2020,37(1):66-70. 被引量：1
4韩佳良.浅谈综合调度与成本控制[J].城镇供水,2000(2):21-23.
5周春光.微软文化的魅力[J].经济管理,2000,26(4):40-42. 被引量：1
6李文慧,张英俊,潘理虎.多因素影响特征选择的短文本分类方法[J].计算机系统应用,2018,27(12):216-221. 被引量：3
7殷功俊.基于词向量的向量空间模型的改进[J].现代计算机,2018,24(24):32-35. 被引量：1
8孙玫,张森,聂培尧,聂秀山.基于朴素贝叶斯的网络查询日志session划分方法研究[J].南京大学学报（自然科学版）,2018,54(6):1132-1140. 被引量：4
9秦宇君,史存会,刘悦,俞晓明,程学旗.多源文本下结合实体的事件发现方法ESP[J].山西大学学报（自然科学版）,2019,42(1):41-50. 被引量：2
10苏良良,雷蕾,李景文,黄敏杰.基于Word2Vec技术隐性特征挖掘及潜在升级投诉用户识别研究[J].电信技术,2018(12):36-39. 被引量：1

同被引文献51

1吴湖,王永吉,王哲,王秀利,杜栓柱.两阶段联合聚类协同过滤算法[J].软件学报,2010,21(5):1042-1054. 被引量：83
2杨阳,向阳,熊磊.基于矩阵分解与用户近邻模型的协同过滤推荐算法[J].计算机应用,2012,32(2):395-398. 被引量：51
3朱郁筱,吕琳媛.推荐系统评价指标综述[J].电子科技大学学报,2012,41(2):163-175. 被引量：255
4陈克寒,韩盼盼,吴健.基于用户聚类的异构社交网络推荐算法[J].计算机学报,2013,36(2):349-359. 被引量：125
5邓晓懿,金淳,韩庆平,樋口良之.基于情境聚类和用户评级的协同过滤推荐模型[J].系统工程理论与实践,2013,33(11):2945-2953. 被引量：53
6刘海鸥,孙晶晶,张亚明,赵攀.在线社交活动中的用户画像及其信息传播行为研究[J].情报科学,2018,36(12):17-21. 被引量：35
7印鉴,王智圣,李琪,苏伟杰.基于大规模隐式反馈的个性化推荐[J].软件学报,2014,25(9):1953-1966. 被引量：58
8赵森栋,刘挺.因果关系及其在社会媒体上的应用研究综述[J].软件学报,2014,25(12):2733-2752. 被引量：15
9邢千里,刘列,刘奕群,张敏,马少平.微博中用户标签的研究[J].软件学报,2015,26(7):1626-1637. 被引量：34
10张绍武,尹杰,林鸿飞,魏现辉.基于用户分析的微博用户影响力度量模型[J].中文信息学报,2015,29(4):59-66. 被引量：12

引证文献5

1马倩,王新,郑承宇,王婷.基于社区专家用户权威度的微博推荐算法研究[J].云南民族大学学报（自然科学版）,2020,29(6):628-634. 被引量：3
2陈敏璇,戴欢,高玉建,付保川,王金鹏.面向多领域跨学科的专家遴选算法[J].计算机工程与设计,2022,43(6):1671-1677. 被引量：1
3赵凯华,徐建民,鲍彩倩.一个基于信念网络的微博推荐模型[J].河北大学学报（自然科学版）,2022,42(4):438-448. 被引量：3
4何羽丰,徐建民,张彬.融合用户聚类与Bandits算法的微博推荐模型[J].小型微型计算机系统,2022,43(10):2122-2130. 被引量：1
5徐建民,张钊源.基于传播树的微博推荐模型[J].计算机应用研究,2023,40(8):2304-2310.

二级引证文献7

1单晓红,崔凤艳,刘晓燕.融合话题多维特征和用户兴趣偏好的微博话题推荐研究[J].现代情报,2022,42(5):69-76. 被引量：10
2王文苑,姜惠.卫生健康人才评价专家遴选的问题与对策——以糖尿病护理领域为例[J].今日科苑,2023(3):31-39.
3龚花萍,艾承兴,黎文涛,李伟,欧芳佐.在线学术社区知识交流服务能力成熟度评价与实证研究[J].图书馆学研究,2023(3):9-22. 被引量：4
4谢哲伟.基于客户购买心理分析的汽车网络销售策略[J].内燃机与配件,2023(22):111-115.
5张彬,郝利新,张国防.融合元图邻域的知识图谱推荐模型[J].计算机应用研究,2024,41(8):2412-2418. 被引量：1
6庞庆华,徐珣,张丽娜.融合微博多维特征和用户动态兴趣的主题推荐研究[J].数据分析与知识发现,2025,9(1):110-120.
7张彬,祖后敏,吴姣.融合社交关系和知识图谱的双图注意力推荐模型[J].现代情报,2025,45(4):12-22.

1王颖.科技文献内容语义描述模型研究[J].农业图书情报学报,2020,32(8):12-24. 被引量：9
2朱蕊.基于数据挖掘的高校图书馆室内空气污染评价模型构建研究[J].环境科学与管理,2020,45(9):190-194. 被引量：1
3李琳,唐守廉.融合内容表示的度量排序学习推荐模型[J].电子学报,2020,48(8):1615-1622. 被引量：8
4陈友玲,张哲,刘舰,吕松洋,段克华.基于环境视频语义的云制造资源描述[J].计算机集成制造系统,2020,26(7):1896-1904. 被引量：1
5宋羽,陈喆,石信肖,李国远.地下综合管廊的三维可视化研究[J].测绘与空间地理信息,2020,43(9):186-188. 被引量：2
6郭红梅,沈哲思,曾建勋.基于文献引证及其内容相似度的主题混合聚类方法研究[J].情报理论与实践,2020,43(9):165-170. 被引量：2
7张应和.基于改进的新息自适应卡尔曼MEMS陀螺仪温度补偿[J].西安轨道交通职业教育研究,2020(3):19-23.
8杨执钧,刘刚,黄蕾,乔丹,白雪,钟韬.基于视觉惯性的非结构化场景重构测距[J].计算机应用研究,2020,37(S01):366-367. 被引量：1
9许颖,严常燕,杨伟聪,张云晓,于洋,黄显会.金霉素微囊颗粒在猪体内的比较药动学研究[J].中国农业科学,2020,53(19):4083-4091. 被引量：1
10张文鑫,强胜龙,尹强,崔显涛,马党伟,贺涛,张旭,郝江涛.RMC程序多普勒展宽舍弃修正功能对堆芯计算的影响研究[J].中国核电,2020,13(4):438-442.

计算机科学

2020年第10期

浏览历史

内容加载中请稍等...

融合内容相似度与多特征计算的个性化微博推荐模型被引量：5

参考文献8

二级参考文献126

共引文献351

同被引文献51

引证文献5

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

融合内容相似度与多特征计算的个性化微博推荐模型 被引量：5

参考文献8

二级参考文献126

共引文献351

同被引文献51

引证文献5

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

融合内容相似度与多特征计算的个性化微博推荐模型被引量：5