结合图卷积神经网络的文献作者姓名消歧被引量：1

Literature Name Disambiguation Combined with Graph Convolutional Neural Network

下载PDF

导出

摘要在科学文献管理中,存在大量的科学技术文献需要被高效的识别、分类和保存.对于研究者来说,在研究该领域的相关知识时,通常会检索该领域的相关专家的文章,然而,姓名作为检索的常见搜索经常会出现歧义问题,这导致文献检索、统计和分析的质量下降.现有的方法在数据集上仍不能表现出良好的聚类效果,如何实现有效的消歧方法仍是一项挑战.本文提出基于图卷积神经网络的作者姓名消歧技术.首先使用BERT模型将文献作者、出版机构、摘要等多种属性信息嵌入到低维向量空间中,得到与作者相关的多种属性的嵌入向量,克服嵌入向量不够准确的缺陷;接下来以节点嵌入为基础,为每篇文献都构建文献局部图,使用图卷积神经网络对生成的文献局部图进行链路预测,有助于提高链路预测的准确性;最后,在图上使用简单的连通域搜索并动态剪枝进行聚类.基于实验表明,本文提出的方法有比较好的性能提升,能够提高作者姓名消歧的准确性. In the management of scientific documents,there are a large number of scientific and technological documents that need to be efficiently identified,classified and preserved.For researchers,when studying the relevant knowledge in this field,they usually search the articles of relevant experts in this field.However,as a common search for retrieval,names often lead to ambiguity,which leads to a decline in the quality of literature retrieval,statistics and analysis.Existing methods still cannot showgood clustering effect on data sets,and howto implement effective disambiguation methods is still a challenge.In this paper,author name disambiguation technology based on graph convolution neural network is proposed.Firstly,BERT model is used to embed various attribute information such as document author,publishing organization,abstract,etc.into low-dimensional vector space to obtain embedding vectors of various attributes related to the author,thus overcoming the defect of inaccurate embedding vectors.Next,based on node embedding,a local document map is constructed for each document,and a graph convolution neural network is used to predict the link of the generated local document map,which is helpful to improve the accuracy of link prediction.Finally,simple connected domain search and dynamic pruning are used to cluster on the graph.Based on experiments,the proposed method has better performance and can improve the accuracy of author name disambiguation.

作者施浓聂铁铮申德荣寇月于戈 SHI Nong;NIE Tie-zheng;SHEN De-rong;KOU Yue;YU Ge(School of Computer Science and Engineering,Northeastern University,Shenyang 110169,China)

机构地区东北大学计算机科学与工程学院

出处《小型微型计算机系统》 CSCD 北大核心 2021年第10期2217-2222,共6页 Journal of Chinese Computer Systems

基金中央高校基础科研业务费项目(N180716010)资助国家自然科学基金项目。

关键词作者消歧图卷积神经网络节点嵌入链路预测命名实体 author disambiguation graph convolutional neural network node embedding link prediction name dentity recognition

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献15

1吕尧,单小彩,霍守东,杨长春.基于深度卷积神经网络的地震数据局部信噪比估计[J].地球物理学报,2020,63(1):320-328. 被引量：10
2陆瑜芳.面向数字图书馆的高校文献检索课程改革对策研究[J].情报科学,2020,38(1):98-102. 被引量：10
3冯兴杰,程毅玮.基于深度卷积神经网络与哈希的图像检索[J].计算机工程与设计,2020,41(3):670-675. 被引量：5
4张笑梅.高校图书馆文献采购和读者服务工作的指南——《高校图书馆文献采编与读者服务研究》荐读[J].情报理论与实践,2020,43(5). 被引量：8
5于晓明,史胜楠,甘克勤.基于Solr的标准信息检索技术及其优化[J].科学技术与工程,2020,20(4):1504-1508. 被引量：13
6赵泽宇,张卫强,刘加.采用注意力机制和多任务训练的端到端无语音识别关键词检索系统[J].信号处理,2020,36(6):839-851. 被引量：19
7杨红菊,陈庚峰.基于卷积神经网络约束编码的图像检索方法[J].山西大学学报（自然科学版）,2020,43(2):280-286. 被引量：5
8张学珍,尹君,白孟鑫,李艳波,郑景云.面向ResearchGate的古气候文献数据采集系统的研制与应用测评[J].地理科学进展,2020,39(7):1140-1148. 被引量：3
9黄辉.大学图书馆文献资源检索利用技巧探究[J].大学图书馆学报,2020,38(6). 被引量：5
10汤磊,丁博,何勇军.基于卷积神经网络的高效三维模型检索方法[J].电子学报,2021,49(1):64-71. 被引量：11

引证文献1

1张馨月.基于卷积神经网络的图书馆文献自动检索机器人研究[J].自动化与仪器仪表,2022(8):194-198. 被引量：5

二级引证文献5

1韩向阳.基于卷积神经网络的中文语音识别人机交互系统设计[J].自动化与仪器仪表,2023(7):201-204. 被引量：4
2侯立原,袁泉,杨钧清,张仕韬,陈鹏.国内图书馆人工智能领域研究主题、趋势与展望——基于CiteSpace的知识图谱分析[J].技术与市场,2023,30(12):80-85.
3高家琦,马秀峰.基于文献计量的国内图书馆人工智能应用研究探析[J].图书情报导刊,2023,8(10):1-11. 被引量：3
4郑默思,张亮.“新工科”背景下用于机械设计课程的双足教学机器人设计与研究[J].自动化与仪器仪表,2023(11):217-221. 被引量：1
5王瑞存,李金英.基于随机森林算法的图书馆文献信息自动检索方法[J].计算机应用文摘,2024,40(13):135-137.

1杨崇磊.如何学好党的经典文献[J].前线,2021(8):51-53.
2《南方农业学报》编辑部.关于录用稿件版权转让的声明[J].南方农业学报,2021,52(7):1911-1911.
3国际学术传播工具--ORCID[J].华西口腔医学杂志,2021,39(5):546-546.
4袁雪梅.大数据时代高校就业质量研究的热点主题与前沿演进--基于CiteSpace的可视化分析[J].服装论丛,2021(2):72-76.
5田芳洁,王宇晴,丁意丽,冀飞.近30年突聋研究的文献计量学分析[J].中华耳科学杂志,2021,19(5):806-811. 被引量：4
6瞿强,杨凯利,张其静,张雪清,娄红红.一种针对电力大数据融合与异常检测的改进方法[J].电力大数据,2021,24(7):24-30. 被引量：1
7李娟,张斌,章翔.中国体育治理研究热点、演化趋势及展望[J].淮南师范学院学报,2021,23(5):123-130. 被引量：1
8王晓敏,刘宾,赵鹏翔.基于双目去歧义的偏振三维重建技术研究[J].光学与光电技术,2021,19(5):24-29. 被引量：1

小型微型计算机系统

2021年第10期

浏览历史

内容加载中请稍等...

结合图卷积神经网络的文献作者姓名消歧被引量：1

同被引文献15

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

结合图卷积神经网络的文献作者姓名消歧 被引量：1

同被引文献15

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

结合图卷积神经网络的文献作者姓名消歧被引量：1