基于Python的微博用户关系挖掘研究被引量：15

Python- based Analysis of Microblog User's Relationship Mining

下载PDF

导出

摘要以新浪微博平台为研究对象,利用Python语言和Web自动化工具通过平台提供的应用接口实现自动认证和微博数据的自动抓取,将其转换成需要的数据格式之后,运用深度优先搜索算法进行分析,获得用户的关系并可视化。此外,采用改进的K-means算法进行主题聚类,实验结果表明,改进后的算法更加准确有效。最后,根据用户信息生成兴趣相关性矩阵,采用改进后的K-means算法分析微博用户关注兴趣的相似性。 Taking Sina Weibo platform as the research object, we can automatically obtain the authorization and grab the microblog data from the application interface by using Python language and Web automation tools. Then, the data are converted into the required format. The depth first search algorithm is used to analyze the user relationship, and the relationship is visualized. In addition, the improved K- means algorithm is proposed for topic clustering analysis. Experimental results demonstrate that the proposed method is more accurate and effective. Finally, an interest correlation matrix is generated based on the user information; the improved K-means algorithm is used to an- alyze the similarity of attention behavior between Microblog users.

作者林晓丽胡可可胡青

机构地区武汉科技大学计算机科学与技术学院武汉科技大学城市学院

出处《情报杂志》 CSSCI 北大核心 2014年第6期144-148,共5页 Journal of Intelligence

基金湖北省教育厅科学技术研究计划指导性项目"基于LP的社交网络用户关系挖掘平台"(编号:B2013258)

关键词新浪微博用户关系数据挖掘聚类分析 Sina Weibo user relationship data mining clustering analysis

分类号 C931 [经济管理—管理学]

引文网络
相关文献

参考文献16

1王连喜,蒋盛益,庞观松,吴美玲.微博用户关系挖掘研究综述[J].情报杂志,2012,31(12):91-97. 被引量：27
2康伟.基于SNA的突发事件网络舆情关键节点识别——以“7·23动车事故”为例[J].公共管理学报,2012,9(3):101-111. 被引量：109
3袁园,孙霄凌,朱庆华.微博用户关注兴趣的社会网络分析[J].情报分析与研究,2012(2):68-75.
4李平,刘洋.信息检索分析与展示[M].北京:清华大学出版社,2012.
5程学旗,沈华伟.社会信息网络中的社区分析[J].中国计算机学会通讯,2012,7(12):12—20.
6杨尊琦,张倩楠.基于k-means算法的微博用户推荐功能研究[J].情报杂志,2013,32(8):142-144. 被引量：16
7张国安,钟绍辉.基于k均值聚类的微博用户分类的研究[J].电脑知识与技术（过刊）,2012,18(9X):6273-6275. 被引量：6
8Mark Granovetter. The Strength of Weak Ties [ J ]. The Ameri- can Joumal of Sociology. 1973, 78 (6) : 1360 - 1380.
9张丹,何跃.基于聚类分析的SNS网络研究[J].情报杂志,2012,31(5):62-65. 被引量：3
10王晓光.微博客用户行为特征与关系特征实证分析——以“新浪微博”为例[J].图书情报工作,2010,54(14):66-70. 被引量：106

二级参考文献128

1丁楠,潘有能.h指数和g指数评价实证研究——基于CSSCI的统计分析[J].图书与情报,2008(2):001-004. 被引量：32
2刘浪,邓伟,采峰,陈玲.节点重要度计算的新方法——优先等级法[J].中国管理科学,2007,15(z1):162-165. 被引量：6
3张丹,何跃.基于聚类分析的SNS网络研究[J].情报杂志,2012,31(5):62-65. 被引量：3
4安世虎,聂培尧,贺国光.节点赋权网络中节点重要性的综合测度法[J].管理科学学报,2006,9(6):37-42. 被引量：27
5冯锋,王凯.产业集群内知识转移的小世界网络模型分析[J].科学学与科学技术管理,2007,28(7):88-91. 被引量：29
6王伟,靖继鹏.公共危机信息传播的社会网络机制研究[J].情报科学,2007,25(7):979-982. 被引量：28
7新浪科技.加拿大媒体分析机构剖析Twitter.[2009-12-20].http://tech.sina.com.cn/i/2009-06-12/16233175010_2.shtml.
8KATZ E , LAZARSFELD P F. Personal Influence: The Part Played by People in the Flow of Mass Communications [M]. United States of America: The Free Press, 1968.
9HELSOOT I, RUITENBERG A. Citizen Response to Disasters:A Survey of Literature and Some Practical Implications [J]. Journal of Crisis and Contingencies Management, 2004, 12 (3): 98-111.
10DUGGAN F, BANWELL L. Constructing a Model of Effective Information Dissemination in a Crisis [J]. Information Research, 2004, 5(3): 178-184.

共引文献289

1相德宝,曹春晓,庄思雨.崛起与遏制:基于社会网络分析的贸易战中美国家形象研究[J].中国网络传播研究,2019(1).
2彭庆军,何雨菲.应急管理中政府部门合作的网络结构特征分析——以武汉市突发事件应急预案为例[J].中国应急管理科学,2022(8):92-105.
3张大勇,张岂凡.在线社交网络节点中心性与关联度的统计分析[J].新媒体研究,2022,8(24):8-15. 被引量：1
4陈武,张海波.社交网络中灾害信息传播的“脱嵌”现象初探——以2021年南通风灾为例[J].风险灾害危机研究,2023(1):27-63. 被引量：1
5杨辉,尚智丛.微博科学传播机制的社会网络分析——以转基因食品议题为例[J].科学学研究,2015,33(3):337-346. 被引量：25
6吴少华,崔鑫,胡勇.基于SNA的网络舆情演变分析方法[J].四川大学学报（工程科学版）,2015,47(1):138-142. 被引量：14
7王晓光,滕思琦.微博社区中非正式交流的实证研究——以“Myspace 9911微博”为例[J].图书情报工作,2011,55(4):39-43. 被引量：16
8王晓光,袁毅,滕思琦.微博社区交流网络结构的实证分析[J].情报杂志,2011,30(2):199-202. 被引量：39
9赵文兵,朱庆华,吴克文,黄奇.微博客用户特性及动机分析——以和讯财经微博为例[J].现代图书情报技术,2011(2):69-75. 被引量：32
10黄映玲.微博传播机制及其在教育中的有效应用分析[J].中国教育信息化（基础教育）,2011(4):15-17. 被引量：11

同被引文献169

1苏新宁,杨国立.我国情报学学科建设研究进展[J].情报学进展,2020(1):1-38. 被引量：16
2卫志华,孔思尹,丁志军,赵才荣.新工科背景下数据挖掘课程综合性实验设计[J].计算机教育,2020(3):127-130. 被引量：20
3傅向华,马兆丰,何明,冯博琴.一种个性化的主题提取和层次发现算法[J].西安交通大学学报,2005,39(2):119-122. 被引量：5
4张玉芳,彭时名,吕佳.基于文本分类TFIDF方法的改进与应用[J].计算机工程,2006,32(19):76-78. 被引量：121
5邱宇红,郭继军.向量空间模型在医学文献相关性研究中的应用[J].现代图书情报技术,2007(7):63-67. 被引量：6
6陈胜可.SPSS统计分析从人门到精通[M].北京:清华大学出版社,2010.238-247.
7Salton G ’ Wang A,Yang C S. A Vector Space Model for Infor-mation Retrieval [ J ] . Journal of the American Society for Infor-mation Science,1975 ,18 (11) :613 - 620.
8PELEG D,MOOtkE A.X-means: Extending K-means with Efficient Estimation of the Number of Clusters [C]//Proceedings of the Seventeenth International Conference on Machine Learning. San Francisco:Morgan Kaufmann Publishers,2000:89-97.
9郭建永,蔡勇,甄艳霞.基于文本聚类技术的主题发现[J].计算机工程与设计,2008,29(6):1426-1428. 被引量：15
10陈慧萍,林莉莉,王建东,苗新蕊.WEKA数据挖掘平台及其二次开发[J].计算机工程与应用,2008,44(19):76-79. 被引量：35

引证文献15

1姬朝阳.一种基于标签耦合分析的微博用户关系挖掘方法[J].情报杂志,2015,34(2):164-167. 被引量：4
2高哲,罗挺豪,赵珓言,杜健平,唐建鹏,陈荣钦.基于微博内容的用户兴趣爱好分类模型[J].台州学院学报,2015,37(3):18-21.
3张士豪,顾益军,张俊豪.基于用户聚类的热门微博分类研究[J].信息网络安全,2015(7):84-89. 被引量：10
4徐童童.微博主题发现方法综述[J].内蒙古科技与经济,2015(19):81-83.
5仇丽青,陈卓艳,丁长青,刘海燕.基于改进LDA主题模型的社会网络话题发现算法iMLDA[J].情报科学,2016,34(9):115-118. 被引量：6
6刘奇飞.基于兴趣的微博用户关系分析原型系统研究[J].信息网络安全,2016(9):240-245. 被引量：4
7陈政伊,袁云静,贺月锦,武瑞轩.基于Python的微博爬虫系统研究[J].大众科技,2017,19(8):8-11. 被引量：9
8梁思远.浅谈利用paython语言完成电商网站商品信息的爬取代码设计[J].数码世界,2018,0(2):262-262.
9许建豪,王厚奎.基于大数据的网络话题发现技术研究初探[J].大众科技,2018,20(8):7-8.
10郭卫东,周锦来.基于机器学习的众包业务动态定价[J].技术经济,2018,37(8):123-130. 被引量：1

二级引证文献57

1张昉.碰瓷营销在社交媒体平台收割“免费流量”的策略运用——以周杰伦打榜事件为例[J].新闻传播,2020(24):28-29.
2梁兆东,朱土凤,安旭东,李崇洁,廖冬梅,周琦杰.基于信息化技术实现2次地震事件评论数据的挖掘分析[J].华北地震科学,2020,38(S02):144-151.
3韩帅康,江涛,张顺.大数据评论采集分析系统的设计与实现[J].电脑知识与技术,2020,0(4):35-37. 被引量：1
4张俊豪,顾益军,张士豪.基于距离模型的用户关系强度评估[J].信息网络安全,2015(10):86-91. 被引量：2
5封红旗,沈田予,杨长春.社交网络通信目标检测优化仿真研究[J].计算机仿真,2015,32(12):164-167. 被引量：1
6周红福,贾璐,张婷婷,李剑.微博舆情分析中信息转发路径提取方法研究[J].信息网络安全,2016(4):61-68. 被引量：8
7吴晓平,周舟,李洪成.Spark框架下基于无指导学习环境的网络流量异常检测研究与实现[J].信息网络安全,2016(6):1-7. 被引量：16
8李翠霞,王有为.海量医学数据中的特定数据挖掘模型仿真分析[J].计算机仿真,2016,33(8):342-345. 被引量：2
9蔡霖翔.网络诈骗案件涉案人群智能分析[J].信息网络安全,2016(9):246-250. 被引量：1
10孙晓冬,肖萍.基于主动模式的互联网舆情监控系统设计[J].信息网络安全,2016(9):272-277. 被引量：2

1杨尊琦,张倩楠.基于k-means算法的微博用户推荐功能研究[J].情报杂志,2013,32(8):142-144. 被引量：16
2王昭倩.青年“微博热”的冷思考[J].北京教育（德育）,2011,0(5):10-11.
3陈可.社交网络营销策略及其盈利模式探讨[J].全国商情,2016(11):30-31. 被引量：1
4叶琪.决策支持系统中的数据预处理[J].微型电脑应用,2003,19(11):46-47. 被引量：4
5岳香芬.网络舆情文献聚类分析[J].科技创业月刊,2012,25(6):149-151. 被引量：4
6赵旭红.班主任要做到一心、二用、三导、四细[J].教师,2008(11):8-9.
7王昱,刘作仪.管理数据挖掘研究的基金资助进展分析[J].管理学报,2012,9(11):1674-1678.
8数据科学家可能成为2015年最热门职业[J].知识文库,2015,0(2):17-18.
9朱平利.企业中人岗匹配度测算模型及其应用[J].湖北工业大学学报,2009,24(6):58-59. 被引量：9
10王洪春,徐群,陶志凌.领导干部对社会管理对象的认知偏差分析[J].中共乐山市委党校学报,2012,14(3):61-63.

情报杂志

2014年第6期

浏览历史

内容加载中请稍等...

基于Python的微博用户关系挖掘研究被引量：15

参考文献16

二级参考文献128

共引文献289

同被引文献169

引证文献15

二级引证文献57

相关作者

相关机构

相关主题

浏览历史

基于Python的微博用户关系挖掘研究 被引量：15

参考文献16

二级参考文献128

共引文献289

同被引文献169

引证文献15

二级引证文献57

相关作者

相关机构

相关主题

浏览历史

基于Python的微博用户关系挖掘研究被引量：15