基于树结构的代码检索方法

Code retrieval method based on tree structure

下载PDF

导出

摘要随着软件项目规模的不断增大和开源代码库的日益丰富,快速、准确的代码检索变得至关重要。传统基于关键词的搜索方法存在效率低和准确性不高等问题,因此文章提出了一种基于树结构的项目源代码检索方法,结合代码和注释构建多层次树结构,以帮助开发者更好地理解代码关系,进而准确定位所需代码。通过汇聚相似代码元素、过滤非相关代码,该方法可有效提高代码检索的准确性。实验结果显示,基于树结构的代码检索方法在准确率、召回率和F1值方面显著优于传统的文本匹配和图嵌入方法,可提供高效、准确的代码检索工具,从而提高开发效率和代码重用质量,有望在软件开发中产生积极影响。 With the continuous increase in software project scale and the enrichment of open source code libraries,fast and accurate code retrieval has become crucial.Traditional keyword based search methods suffer from low efficiency and accuracy.Therefore,this article proposes a tree based project source code retrieval method,which combines code and annotations to construct a multi-level tree structure to help developers better understand code relationships and accurately determine the required code.This method can effectively improve the accuracy of code retrieval by aggregating similar code elements and filtering irrelevant code.The experimental results show that the tree based code retrieval method is significantly better than traditional text matching and graph embedding methods in terms of accuracy,recall,and F1 value.It can provide efficient and accurate code retrieval tools,thereby improving development efficiency and code reuse quality,and is expected to have a positive impact on software development.

作者糜伊杨余芊瞳魏念青 MI Yiyang;YU Qiantong;WEI Nianqing(Chengdu University of Information Technology,Chengdu 610225,China)

机构地区成都信息工程大学

出处《计算机应用文摘》 2024年第7期125-127,共3页 Chinese Journal of Computer Application

关键词代码检索多层次树结构信息检索 code retrieval multi level tree structure information retrieval

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1黎宣,王千祥,金芝.基于增强描述的代码搜索方法[J].软件学报,2017,28(6):1405-1417. 被引量：14
2林泽琦,赵俊峰,谢冰.一种基于图数据库的代码结构解析与搜索方法[J].计算机研究与发展,2016,53(3):531-540. 被引量：8
3黄丽韶.基于语法结构的源代码搜索的研究[J].电脑与电信,2013(5):30-33. 被引量：4
4刘石,李合,王啸吟,张路,谢冰.基于语法与语义分析的代码搜索结果优化[J].计算机科学,2009,36(8):165-168. 被引量：6
5顾逸圣,曾国荪.基于语法和语义结合的源代码精确搜索方法[J].计算机应用,2017,37(10):2958-2963. 被引量：5
6李阵,钮俊,王奎,辛园园.基于多特征权重分配的源代码搜索优化[J].计算机应用,2018,38(3):812-817. 被引量：6
7凌春阳,邹艳珍,林泽琦,谢冰,赵俊峰.基于图嵌入的软件项目源代码检索方法[J].软件学报,2019,30(5):1481-1497. 被引量：10

二级参考文献38

1Jacobson I,等.软件复用:结构、过程和组织[M].韩柯,译.北京:机械工业出版社.
2Hoffmann R, Fogarty J. DS Weld Assieme : finding and leveraging implicit references in a web search interface for programmers[C]//Proceedings of UIST'2007.
3Sim S E,Clarke C L A, Holt R C. Archetypal source code searches:A survey of software developers and maintainers[C]//IWPC. 1998.
4Jiang Lingxiao, Misherghi G, Su Zhendong, et al. DECKARD : Scalable and Accurate Tree-based Detection of Code Clones[C] //ICSE 2007.
5Codase[OL]. http://www. codase. com/.
6CSourceSe-arch[OL]. http:///csourcesearch. net/.
7Sourcerer: A Search Engine for Open Source Code[OL]. http://sourcerer. ics. uci. edu/.
8Koders[OL]. http: //www. koders.com/.
9Krugle[OL]. http: //www.krugle. com.
10Google Code Search[OL]. http: //www. google. com/eodesearch.

共引文献31

1黄丽韶.基于语法结构的源代码搜索的研究[J].电脑与电信,2013(5):30-33. 被引量：4
2张康,曾国荪.开源对软件工程的作用及关键搜索技术分析[J].微型机与应用,2015,34(24):8-12. 被引量：1
3林婵,李俊杰,饶飞,罗平.基于索引的分布式代码克隆检测[J].信息安全研究,2016,2(3):201-210. 被引量：3
4孙伟松,孙小兵,李斌,杨辉.软件历史代码库词库自动构建技术及实现[J].中国科学技术大学学报,2017,47(1):80-86. 被引量：3
5黄丽韶.克隆代码检测在代码搜索中的应用研究[J].无线互联科技,2017,14(19):45-46. 被引量：1
6顾逸圣,曾国荪.基于语法和语义结合的源代码精确搜索方法[J].计算机应用,2017,37(10):2958-2963. 被引量：5
7李阵,钮俊,王奎,辛园园.基于多特征权重分配的源代码搜索优化[J].计算机应用,2018,38(3):812-817. 被引量：6
8李润青,曾国荪.程序源代码中的切片摘要提取及在搜索中的应用[J].信息技术与网络安全,2018,37(3):122-125. 被引量：2
9孙小兵,王璐,王经纬,李斌,李宇.基于知识图谱的bug问题探索性搜索方法[J].电子学报,2018,46(7):1578-1583. 被引量：8
10李宇琨,彭鑫,赵文耘.基于众包问答信息的API使用代码搜索[J].计算机应用与软件,2018,35(7):43-51. 被引量：1

1时飞.IT项目管理中的影响因素与改善方法分析[J].互联网周刊,2024(7):30-32.
2张利娜,康冰,苏娟.从软件重用走向产品化的探索[J].航天工业管理,2024(2):62-65. 被引量：1

计算机应用文摘

2024年第7期

浏览历史

内容加载中请稍等...

基于树结构的代码检索方法

参考文献7

二级参考文献38

共引文献31

相关作者

相关机构

相关主题

浏览历史