一种基于数据的GitHub项目个性化混合推荐方法被引量：5

A Data-Based Personalized Mixed Recommendation Method for GitHub Projects

下载PDF

导出

摘要将两种传统基于内存的协同过滤方法相结合,提出一种基于数据的GitHub项目个性化混合推荐方法.该方法不仅可动态地计算相似用户以保证推荐的个性化,且只用很小规模的相似用户便可得到与基于项目的方法相近的推荐质量;同时,该方法通过建立倒排表和利用K均值分类,在一定程度上解决了原方法在面对GitHub用户及项目数量级较大但交叉度较低的数据集时数据稀疏和冷启动问题.通过与传统方法进行对比实验,验证了该方法的有效性和优越性. We combined the traditional two memory-based collaborative-filtering methods and proposed a data-based personalized mixed recommendation method for GitHub projects.The method could not only calculate the similar users dynamically to ensure the personalized recommendation,but also obtain the recommendation quality comparable to the item-based method with only small scale of similar users.At the same time,the method solved the data sparsity and cold boot problems of the original method in the face of GitHub,a data set of users and projects of an order of magnitude but with low degree of crossover to some extent by establishing inverse table and using K-means classification.By comparing with the traditional method,we verified the effectiveness and superiority of the proposed method.

作者何锴琦马宇骁张炎刘华虓 HE Kaiqi;MA Yuxiao;ZHANG Yan;LIU Huaxiao(School of Graduate,Jilin University,Changchun 130012,China;College of Engineering,Northeastern University,Boston 02115,USA;College of Computer Science and Technology,Jilin University,Changchun 130012,China)

机构地区吉林大学研究生院美国东北大学工程学院吉林大学计算机科学与技术学院

出处《吉林大学学报（理学版）》 CAS 北大核心 2020年第6期1399-1406,共8页 Journal of Jilin University:Science Edition

基金吉林省自然科学基金(批准号:20190201193JC)。

关键词数据分析推荐系统协同过滤技术冷启动 data analysis recommendation system collaborative-filtering technology cold boot

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1张晓琳,付英姿,褚培肖.杰卡德相似系数在推荐系统中的应用[J].计算机技术与发展,2015,25(4):158-161. 被引量：44
2Xiaobing SUN,Wenyuan XU,Xin XIA,Xiang CHEN,Bin LI.Personalized project recommendation on Git Hub[J].Science China(Information Sciences),2018,61(5):83-96. 被引量：5

二级参考文献14

1张光卫,李德毅,李鹏,康建初,陈桂生.基于云模型的协同过滤推荐算法[J].软件学报,2007,18(10):2403-2411. 被引量：197
2Ricci F, Rokach L, Shapira B, et al. Recommender systems handbook[ M]. Is. 1. ] :Springer,2010.
3Hill W, Stead L, Rosenstein M, et al. Recommending and eval- uating choices in a virtual community of use [ C ]//Proc of CHI. [s. 1. ]:Is. n. ],1995:194-201.
4Bobadilla J, Ortega F, Hernando A. A collaborative filtering similarity measure based on singularities[ J]. Information Pro- cessing and Management,2012,48:204-217.
5Greg L, Brent S,York J. Amazon. com recommendations:item -to - item collaborative filtering [ J ]. IEEE Internet Compu- ting,2003,7( 1 ) :76-80.
6Jaccard P. The distribution of the flora in the alpine zone[ J]. New Phytologist, 1912,11 ( 2 ) :37-50.
7Tan Pangning, Steinbach M, Kumar V. Introduction to data mining[ M]. Is. 1. ]:Addison Wesley,2005.
8Anand D, Bharadwaj K K. Utilizing various sparsity measures for enhancing accuracy of collaborative recommender systems based on local and global similarities [ J ]. Expert Systems with Applications ,2011,38 ( 5 ) :5101-5109.
9许海玲,吴潇,李晓东,阎保平.互联网推荐系统比较研究[J].软件学报,2009,20(2):350-362. 被引量：548
10李聪,梁昌勇,杨善林.电子商务协同过滤稀疏性研究:一个分类视角[J].管理工程学报,2011,25(1):94-101. 被引量：21

共引文献47

1周朝阳.杰卡德相似度在图书推荐中的应用研究[J].情报探索,2017(7):43-46. 被引量：5
2迟铭宇.社交地点分类算法设计与实现[J].现代计算机（中旬刊）,2017(7):17-20. 被引量：1
3李勇男,梅建明.ROCK聚类在反恐情报分析中的应用研究[J].情报杂志,2017,36(10):22-25. 被引量：10
4李勇男.基于雅卡尔系数的反恐情报聚类分析[J].现代情报,2018,38(1):51-55. 被引量：10
5Wang Bao-Li.Automatic pickup of arrival time of channel wave based on multi-channel constraints[J].Applied Geophysics,2018,15(1):118-124. 被引量：2
6孙瑶,王贤文.期刊与会议的混合共被引网络分析--以计算机科学领域为例[J].中国科技期刊研究,2018,29(11):1141-1147. 被引量：1
7吴经纬.协同过滤算法的研究[J].电脑知识与技术,2019,15(1X):20-21. 被引量：2
8李广丽,朱涛,袁天,滑瑾,张红斌.混合分层抽样与协同过滤的旅游景点推荐模型研究[J].数据采集与处理,2019,34(3):566-576. 被引量：14
9王博生,何先波,朱广林,郭军平,陶卫国,李丽.基于近邻协同过滤算法的相似度计算方法研究[J].绵阳师范学院学报,2019,38(8):84-90. 被引量：2
10李晓瑜.协同过滤推荐算法研究[J].计算机与数字工程,2019,47(9):2118-2122. 被引量：13

同被引文献29

1张宇镭,党琰,贺平安.利用Pearson相关系数定量分析生物亲缘关系[J].计算机工程与应用,2005,41(33):79-82. 被引量：103
2蔺丰奇,刘益.信息过载问题研究述评[J].情报理论与实践,2007,30(5):710-714. 被引量：65
3李忠俊,周启海,帅青红.一种基于内容和协同过滤同构化整合的推荐系统模型[J].计算机科学,2009,36(12):142-145. 被引量：40
4硕良勋,柴变芳,张新东.基于改进最近邻的协同过滤推荐算法[J].计算机工程与应用,2015,51(5):137-141. 被引量：30
5叶小榕,邵晴.结合物联网和室内定位的手机图书馆推荐系统[J].科技导报,2016,34(23):127-136. 被引量：5
6张应辉,司彩霞.基于用户偏好和项目特征的协同过滤推荐算法[J].计算机技术与发展,2017,27(1):16-19. 被引量：7
7乔雨,李玲娟.推荐系统冷启动问题解决策略研究[J].计算机技术与发展,2018,28(2):83-87. 被引量：23
8王末,郑晓欢,王卷乐,柏永青.基于混合过滤的地学数据个性化推荐方法设计与实现[J].地理研究,2018,37(4):814-824. 被引量：6
9Xiaobing SUN,Wenyuan XU,Xin XIA,Xiang CHEN,Bin LI.Personalized project recommendation on Git Hub[J].Science China(Information Sciences),2018,61(5):83-96. 被引量：5
10王光,张杰民,董帅含,夏帅.基于内容的加权粒度序列推荐算法[J].计算机工程与科学,2018,40(3):564-570. 被引量：18

引证文献5

1李晓娴,游佳,余娇榕,林倩,徐海平.基于内容与协同过滤的GitHub学习资料库推荐[J].河南工程学院学报（自然科学版）,2021,33(2):59-64. 被引量：1
2李雪婷,杨抒,赛亚热·迪力夏提,赵昀杰.融合内容与协同过滤的混合推荐算法应用研究[J].计算机技术与发展,2021,31(10):24-29. 被引量：17
3苗启朋,何丽莉,姜宇,白洪涛.基于全局有向图的商品会话序列推荐算法[J].吉林大学学报（理学版）,2022,60(2):361-368. 被引量：1
4王婷,张悦.跨领域推荐方法研究综述[J].长江信息通信,2024,37(2):173-175.
5林海铭,田春岐,王伟.基于二分网络表示学习的开源项目推荐方法[J].计算机科学与应用,2022,12(1):54-62.

二级引证文献19

1汪欣,张铭毅,刘亚萍.精准推荐技术的工作逻辑和前沿应用[J].传媒论坛,2022,5(16):16-18.
2金子坤.基于电商平台的智能推荐算法研究[J].办公自动化,2022,27(1):25-27. 被引量：4
3李伟.一种上下文感知的旅游信息服务推荐方法[J].福建电脑,2022,38(3):13-15.
4范月祺.云平台中在线学习资源的智能推送模型设计研究[J].山西电子技术,2022(5):77-78. 被引量：3
5王婧婷,岳朋,袁长蓉.白血病患儿父母支持系统APP中症状管理模块的开发与可用性评价[J].中国护理管理,2022,22(10):1458-1461. 被引量：10
6孙红,鹿梅珂.融合用户行为序列预测的混合推荐算法[J].电子科技,2023,36(4):84-89. 被引量：1
7李凯月.基于XLNet-BiLSTM模型的个性化混合推荐算法[J].数字技术与应用,2023,41(3):50-51. 被引量：1
8陈玉帛,项慨,王顺驰,何希,李娅琴,邹正,李玉婷.基于用户画像的课程学习视频推荐系统研究与设计[J].现代信息科技,2023,7(9):1-8. 被引量：4
9张睿轩,张佳璇,李顺勇.基于改进RFM模型的客户筛选及协同过滤推荐算法[J].网络安全技术与应用,2023(7):42-45. 被引量：1
10张兴宇.基于用户兴趣度的微博混合推荐算法研究[J].淮南职业技术学院学报,2023,23(4):146-149.

1东苗,王启宗.基于矩阵分解和层次聚类的协同过滤推荐算法[J].电子技术与软件工程,2020(17):183-185. 被引量：2
2刘宇东,孙豪,蒋运承.融合内容相似度与多特征计算的个性化微博推荐模型[J].计算机科学,2020,47(10):97-101. 被引量：5
3李奋华,赵润林.一种基于领域知识的链路预测方法[J].计算机应用与软件,2020,37(11):206-208. 被引量：2
4张鑫,黄刚.基于信任的托攻击用户检测算法[J].计算机应用与软件,2020,37(11):286-291.
5秦晓安,路贺龙.移动用户群优惠券推荐系统研究[J].赣南师范大学学报,2020,41(6):65-69.
6张扬,方坤,胡勇.基于数据分析的航材分类研究[J].科学技术创新,2020(24):22-23.
7滕传志,赵月旭.基于随机森林-马尔可夫用户冷启动推荐系统[J].计算机工程与设计,2020,41(11):3094-3098. 被引量：8
8卢竹兵,马小琴,吴汶娟,李玉州.基于情感分析和情感遗忘的协同过滤推荐策略[J].重庆师范大学学报（自然科学版）,2020,37(5):103-108. 被引量：4
9徐玉梁,陈利国,白杨,王振,刘捷,赵金旋.汽油发动机双回路冷却系统的研究[J].工程设计学报,2020,27(5):671-680. 被引量：7
10陈佳兴,何华卿,潘芸菲,吴彦文.基于分类模型和SVD的协同过滤算法[J].电子测量技术,2020,43(14):69-73. 被引量：7

吉林大学学报（理学版）

2020年第6期

浏览历史

内容加载中请稍等...

一种基于数据的GitHub项目个性化混合推荐方法被引量：5

参考文献2

二级参考文献14

共引文献47

同被引文献29

引证文献5

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

一种基于数据的GitHub项目个性化混合推荐方法 被引量：5

参考文献2

二级参考文献14

共引文献47

同被引文献29

引证文献5

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

一种基于数据的GitHub项目个性化混合推荐方法被引量：5