基于哈希和双数组trie树的多层次地址匹配算法被引量：12

A multi-level address-matching algorithm based on Hash function and double-array trie-tree.

下载PDF

导出

摘要针对目前地址匹配算法匹配速率低、空间开销大的不足,提出了一种基于哈希和双数组trie树的多层次地址匹配算法.利用中文地址的分类、分层及组合规则,改进了地址匹配词典的构建方式,减少了词典构建的时间和空间开销.通过哈希运算,将空间坐标存储在哈希表相应的位置上,加快了空间坐标的检索效率.同时,在地址匹配的过程中,采用双向扫描及哈希运算代替传统的数据库检索方式,提高了地址匹配速率.最后,通过实验对算法的有效性进行了验证. Based on Hash function and double-array trie-tree, a multi-layer address-matching algorithm is proposed in this paper against several shortcomings of conventional solutions, i.e. low efficiency and huge memory occupation. According to principles of classification, layering and combination for Chinese addresses, the construction method of the address-matching dictionary is optimized and hence its occupation on time and memory is reduced. With hash op- erations, space coordinates are stored in their corresponding hash table positions, in which the retrieval efficiency is improved. Meanwhile, a strategy combining the dual-scan matching and hash operations is used instead of the tradi- tional database retrieval method to augment the address-matching velocity. Experiments are conducted and success- fully verify the algorithm＇s effectiveness.

作者徐聪张丰杜震洪张逸然陈明刘仁义

机构地区浙江大学浙江省资源与环境信息系统重点实验室浙江大学地理信息科学研究所

出处《浙江大学学报（理学版）》 CAS CSCD 2014年第2期217-222,共6页 Journal of Zhejiang University（Science Edition）

基金国家自然科学基金资助项目(41001227) 国家863计划项目(2007AA12Z182 2009AA12Z222) 浙江省科技攻关计划项目(2009C33011) 教育部博士点专项基金资助项目(200803350017) 浙江省自然科学基金资助项目(Y5090130)

关键词哈希函数双数组trie树地址分类地址规则地址匹配 Hash function double array trie-tree~ address classifications address rules address-matching

分类号 P208 [天文地球—地图制图学与地理信息工程]

引文网络
相关文献

参考文献8

1王凌云,李琦,江洲.国内地理编码数据库系统开发与研究[J].计算机工程与应用,2004,40(21):167-168. 被引量：33
2张倩,郭嗣琮.基于有限状态机和Trie数的分级地址模型[J].计算机应用,2013,33(3):854-857. 被引量：5
3赵阳阳,王亮,仇阿根.地址要素识别机制的地名地址分词算法[J].测绘科学,2013,38(5):74-76. 被引量：26
4程昌秀,于滨.一种基于规则的模糊中文地址分词匹配方法[J].地理与地理信息科学,2011,27(3):26-29. 被引量：48
5赵欢,朱红权.基于双数组Trie树中文分词研究[J].湖南大学学报（自然科学版）,2009,36(5):77-80. 被引量：16
6AOE J. An efficient digital search algorithm by using a double-array structure [J]. IEEE Transactions on Software Engineering, 19 8 9,15 ( 9 ) : 10 6 6-10 7 7.
7孙钦东,黄新波,王倩.面向中英文混合环境的多模式匹配算法[J].软件学报,2008,19(3):674-686. 被引量：17
8孙存群,周顺平,杨林.基于分级地名库的中文地理编码[J].计算机应用,2010,30(7):1953-1955. 被引量：23

二级参考文献48

1李丹宁,李丹,王保华,马新强.几种基于词典的中文分词算法评价[J].贵州科学,2008,26(3):1-8. 被引量：4
2朱建伟,王泽民.地理编码原理及其本地化解决方案[J].北京测绘,2004,18(2):24-27. 被引量：17
3高鹏,张德运,孙钦东,翟亚辉,卢伍春.网络信息审计系统中的多模式相似匹配算法[J].软件学报,2004,15(7):1074-1080. 被引量：13
4王凌云,李琦,江洲.国内地理编码数据库系统开发与研究[J].计算机工程与应用,2004,40(21):167-168. 被引量：33
5温滔,朱巧明,吕强.一种快速汉语分词算法[J].计算机工程,2004,30(19):119-120. 被引量：19
6陈细谦,迟忠先,金妮.城市地理编码系统应用与研究[J].计算机工程,2004,30(23):50-52. 被引量：30
7吴胜远.一种汉语分词方法[J].计算机研究与发展,1996,33(4):306-311. 被引量：49
8万国根,秦志光.改进的AC-BM字符串匹配算法[J].电子科技大学学报,2006,35(4):531-533. 被引量：20
9王思力,张华平,王斌.双数组Trie树算法优化及其应用研究[J].中文信息学报,2006,20(5):24-30. 被引量：29
10殷人昆.数据结构(C++语言版)[M].北京:清华大学出版社.1999.

共引文献135

1刘一宁,郭功举,林木棵,王琳.基于位置描述的地理实体信息融合方法[J].测绘通报,2021(S01):65-69. 被引量：7
2简煊祥.基于地理编码的农村历史宗地落宗技术研究与应用[J].安徽地质,2022,32(S02):171-173.
3王周龙,刘晓玫,王大鹏,李德一.太湖流域地理数据库构建[J].水资源保护,2007,23(4):59-61. 被引量：1
4兰小机,彭涛,王飞.赣州市地理编码系统及其关键技术[J].测绘科学,2009,34(2):231-232. 被引量：7
5孙钦东,郭晓军,黄新波.基于多模式匹配的网络视频流识别与分类算法[J].电子与信息学报,2009,31(3):759-762. 被引量：5
6胡雷地,施庆华,汤勇仁,魏琦,张振.基于规则的标准地址公共服务平台设计与实现[J].现代测绘,2012,35(4):30-34. 被引量：3
7孙钦东,管晓宏,周亚东.网络信息内容审计研究的现状及趋势[J].计算机研究与发展,2009,46(8):1241-1250. 被引量：19
8丁浩,李跃华.广告审查系统中绝对化词语自动审查的实现[J].电脑知识与技术,2009,5(10):7934-7936.
9张雪英,闾国年,李伯秋,陈文君.基于规则的中文地址要素解析方法[J].地球信息科学,2010,12(1):9-16. 被引量：74
10胡晓波.综合警用地理信息系统的设计与实现[J].长治学院学报,2009,26(5):24-27. 被引量：2

同被引文献89

1乐娟.基于Trie树的京剧术语语义词典[J].计算机工程,2011,37(S1):30-32. 被引量：3
2陈细谦,迟忠先,金妮.城市地理编码系统应用与研究[J].计算机工程,2004,30(23):50-52. 被引量：30
3林亚平,刘云中,周顺先,陈治平,蔡立军.基于最大熵的隐马尔可夫模型文本信息抽取[J].电子学报,2005,33(2):236-240. 被引量：48
4李宏利,李汉荣,郑崇璞.汉字编码与地理信息系统建设[J].海洋测绘,2005,25(2):37-40. 被引量：1
5苗兰芳,杨传斌.模糊串匹配算法及其应用[J].小型微型计算机系统,1996,17(10):72-76. 被引量：3
6孙钦东,黄新波,王倩.面向中英文混合环境的多模式匹配算法[J].软件学报,2008,19(3):674-686. 被引量：17
7徐飞,孙劲光.中文分词切分技术研究[J].计算机工程与科学,2008,30(5):126-128. 被引量：16
8丁振国,张卓,黎靖.基于Hash结构的逆向最大匹配分词算法的改进[J].计算机工程与设计,2008,29(12):3208-3211. 被引量：26
9赵欢,朱红权.基于双数组Trie树中文分词研究[J].湖南大学学报（自然科学版）,2009,36(5):77-80. 被引量：16
10佟文会,江洲,李小林.地址编码关键技术——地址数据内容规范研究[J].标准科学,2009(11):39-42. 被引量：11

引证文献12

1汪洋,刘师培,王峥.基于Trie树和有限状态自动机的中文地址解析模型[J].计算机与现代化,2016(7):60-67. 被引量：3
2罗明,黄海量.一种基于有限状态机的中文地址标准化方法[J].计算机应用研究,2016,33(12):3691-3695. 被引量：14
3胡晓燕.云计算存储数据动态访问控制方法研究与仿真[J].计算机仿真,2017,34(3):365-368. 被引量：21
4曹广顺,呙维,朱欣焰,佘冰.一种基于key-value数据库的快速地名地址输入提示方法[J].计算机应用研究,2017,34(11):3334-3338. 被引量：1
5应申,李威阳,贺彪,王维,赵朝彬.基于城市地址树的地址文本匹配方法[J].地理信息世界,2017,24(6):81-86. 被引量：7
6陈永杰,吾守尔.斯拉木,于清.一种基于Aho-Corasick算法改进的多模式匹配算法[J].现代电子技术,2019,42(4):89-93. 被引量：16
7吴睿,龙华,熊新,彭艺.一种多策略结合的地址匹配算法[J].河南理工大学学报（自然科学版）,2019,38(5):124-129. 被引量：6
8邹恩岑,曾诚,张谦,徐川,朱润,奚雪峰.一种面向中文非标建筑地址标准化的自动匹配方法[J].苏州科技大学学报（自然科学版）,2019,36(4):66-74. 被引量：5
9姚霄飞,张东,刘爱龙.嵌入式环境下基于Trie树的快速检索方法研究[J].测绘科学与工程,2020,40(3):45-49.
10刘浩宇,李喆,佘佐超,应卓君,王薇,赵志浩.地址模糊匹配在电力企业应用中的研究与实践[J].四川电力技术,2020,43(6):43-48.

二级引证文献70

1张小敏,姚兵.物联网物品信息资源定位优化仿真[J].计算机仿真,2018,35(12):442-445. 被引量：1
2刘治纲,肖庆汇,丁雪非,罗尉平.软件定义网络用户动态访问控制模型仿真[J].计算机仿真,2019,36(1):308-311. 被引量：10
3王信堂,梁志锋.网络恶意入侵下破损数据及时存储方法仿真[J].计算机仿真,2019,36(1):316-319. 被引量：3
4余远剑.基于FME的地址数据标准化关键技术研究与实现[J].测绘与空间地理信息,2017,40(11):53-55. 被引量：5
5罗明,黄海量.基于词汇-语义模式的金融事件信息抽取方法[J].计算机应用,2018,38(1):84-90. 被引量：17
6杨浩,张俊锋,谢昕.网络第三方服务器中用户信息的细粒度访问控制方法[J].科学技术与工程,2018,18(4):82-87. 被引量：2
7罗明,黄海量.一种基于语义标注特征的金融文本分类方法[J].计算机应用研究,2018,35(8):2281-2284. 被引量：9
8李晓林,张懿,周华兵,李霖.基于C-F模型的中文地址行政区划辨识方法[J].计算机工程与设计,2018,39(7):2048-2053. 被引量：3
9陈建辉,郑小东.云计算环境下网络匿名用户安全性认证仿真[J].计算机仿真,2018,35(9):283-286. 被引量：4
10孙军,谈鹏图,林文兴,左晋佺.加密与密文检索云服务系统[J].软件,2018,39(10):92-96. 被引量：1

1齐心协力抗震护水——哈希与您共行动[J].中国给水排水,2008,24(12):78-78.
2齐心协力抗震护水——哈希与您共行动[J].中国仪器仪表,2008(6):23-23.
3王野,张志文.沈阳市地名地址数据采集与建库[J].城市勘测,2013(6):40-43. 被引量：11
4单立华,丁汝福,徐九华.加波萨尔扎河坝—哈希瓮地区成矿地质评价[J].有色金属（矿山部分）,2006,58(6):10-13. 被引量：1
5陆冬华（选译）.关于我们的地球：101个有趣的事实（9）[J].英语沙龙（原版阅读）,2011(12):16-18.
6查斌,何立东.叶里克一带铁矿床磁异常与矿体空间位置相关性分析[J].中国科技博览,2012(34):82-82.
7杨柳,周汉文,朱云海,代雄,林启祥,马占青,菅坤坤,张旻玥.青海格尔木哈希牙地区中基性岩墙群地球化学特征与LA-ICP-MS锆石U-Pb年龄[J].地质通报,2014,33(6):804-819. 被引量：3
8赵红梅.华南地区^（14）C年代数据库系统的建立[J].华南地震,1996,16(2):53-56. 被引量：1
9姚茂华,周文婷.基于动态变粒度的改进基态修正模型研究[J].硅谷,2009,2(17):43-45. 被引量：1
10李宁,苏静,范克楠.WebGIS系统实现二三维联动的方式研究与实现[J].中国科技博览,2013(21):77-77.

浙江大学学报（理学版）

2014年第2期

浏览历史

内容加载中请稍等...

基于哈希和双数组trie树的多层次地址匹配算法被引量：12

参考文献8

二级参考文献48

共引文献135

同被引文献89

引证文献12

二级引证文献70

相关作者

相关机构

相关主题

浏览历史

基于哈希和双数组trie树的多层次地址匹配算法 被引量：12

参考文献8

二级参考文献48

共引文献135

同被引文献89

引证文献12

二级引证文献70

相关作者

相关机构

相关主题

浏览历史

基于哈希和双数组trie树的多层次地址匹配算法被引量：12