基于匹配的异构数据索引方法被引量：2

A match-based indexing approach for heterogeneous data

下载PDF

导出

摘要提出了一种基于关键词描述的数据模型,该模型可以较好地表示结构化数据和非结构化数据。此外还提出了一种基于匹配的异构数据索引方法,其主要思想是预先计算并存储某些特定的查询及相应的结果,索引的构建和查询整体上遵循匹配思想。在构建时,充分利用剪枝及关键词计数排序策略,较大地缩短了索引构建时间;在查询时,主要依靠关键词计数并采用分层检索的方式,较大地减少了用户检索时间。实验结果表明该索引能够较好地解决异构数据索引问题,具有良好的性能。 In this paper, we proposed a keyword-based data model, which can well represent structured data and unstructured data. In addition, we also came up with a partial match-based indexing approach for heterogeneous data. The main idea of the approach is to pre-compute certain queries and store their results. Partial matching is considered in building and querying index on the whole. When building this index, we took advantage of the strategy of pruning and sorting based on keyword count, which significantly shortened the time of construction, and when querying the index, a keywords count and astratified index method were adopted, which greatly lessen the users＇ retrieval time. The experimental results show that the index method can solve the problem of heterogeneous data index excellently and has a good performance.

作者梁英飞童海红刘巍 LIANG Yingfei;TONG Haihong;LIU Wei(AECC Harbin Dongan Engine Corporation LTD Information Archive Center, Harbin 150066, China)

机构地区中国航发哈尔滨东安发动机有限公司信息档案中心

出处《沈阳航空航天大学学报》 2018年第2期60-66,共7页 Journal of Shenyang Aerospace University

关键词异构数据部分匹配数据模型分层索引 heterogeneous data partial match data model stratified index

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1郑霖,徐德华.基于改进TFIDF算法的文本分类研究[J].计算机与现代化,2014(9):6-9. 被引量：27
2王桂玲,韩燕波,张仲妹,朱美玲.基于云计算的流数据集成与服务[J].计算机学报,2017,40(1):107-125. 被引量：52
3张雨佳,苏中滨,吴华瑞,朱华吉,陶勇.半结构化数据的动态树存储模型研究[J].计算机应用与软件,2011,28(5):86-90. 被引量：7
4李政,武彤.基于分布式消息队列的企业级全文检索模型研究[J].计算机应用与软件,2017,34(6):292-295. 被引量：5
5杨书新,徐慧琴.基于数据图的关系数据库关键词查询排序研究[J].计算机应用研究,2014,31(2):440-442. 被引量：2

二级参考文献38

1吴炜鑫,王宇,王兴伟.基于AMQP的校园消息总线系统的设计与实现[J].通信学报,2013,34(S2):180-183. 被引量：10
2金澈清,钱卫宁,周傲英.流数据分析与管理综述[J].软件学报,2004,15(8):1172-1181. 被引量：161
3文继军,王珊.SEEKER:基于关键词的关系数据库信息检索[J].软件学报,2005,16(7):1270-1281. 被引量：46
4张玉芳,彭时名,吕佳.基于文本分类TFIDF方法的改进与应用[J].计算机工程,2006,32(19):76-78. 被引量：121
5叶飞跃,蒙德龙,员红娟.一种用于存储与查询半结构化数据的新方法[J].计算机工程,2006,32(19):91-93. 被引量：3
6吕橙,魏楚元,张瀚韬.基于OEM模型的半结构化数据的模式发现[J].计算机工程与应用,2006,42(34):162-165. 被引量：5
7蒋建洪.主要分布式搜索引擎技术的研究[J].科学技术与工程,2007,7(10):2418-2424. 被引量：10
8Slefankis E.Modelling semi-structured geographical data[J].International Journal of Geographical Information Science,2003,17(6):517-546.
9Abiteboul S.Querying Semi-structured Data[C] //Proc.of ICDT Del phi,Greece:[s,n.] ,1997.
10宋惟然.中文文本分类中的特征选择和权重计算方法研究[D].北京:北京工业大学,2013.

共引文献88

1孟蕾.化学检验软件对于精密数据的处理[J].化学工程与装备,2020(12):275-276.
2于伟杰,杨文忠,任秋如.基于全词BERT的集成用户画像方法[J].东北师大学报（自然科学版）,2022,54(4):87-92. 被引量：4
3周迪民.云计算的智能交通应用系统[J].办公自动化,2020(24):56-57. 被引量：3
4夏才清.华中地区水能资源与可持续发展战略[J].水力发电,2000,26(4):1-4.
5李冬.试论国有企业制度创新的几个问题[J].金山企业管理,2000(1):1619-1619. 被引量：1
6廖海生.基于面向对象的大数据存储模型研究[J].河南科学,2014,32(12):2505-2510. 被引量：4
7张维国,孙效玉,周冲,董波.树形结构数据在数字矿山中的存储管理与应用[J].计算机技术与发展,2015,25(3):150-153. 被引量：4
8解辉,王晓英,金鑫.基于模板知识的带噪音半结构文本数据自动分词方法[J].微型机与应用,2015,34(17):89-91. 被引量：1
9秦瑞,方乐,俞敏.文本分析方法在医学研究中的应用进展[J].浙江预防医学,2015,27(10):1008-1011. 被引量：2
10李念,廖闻剑,彭艳兵.动态置信度的序列选择增量学习方法[J].计算机系统应用,2016,25(2):135-140.

同被引文献9

1郭黎,崔铁军,王豪,郭健.基于面状要素拓扑关系的数据匹配技术研究[J].测绘科学,2010,35(1):130-132. 被引量：14
2虞为,陈俊鹏.基于MapReduce的书目数据关联匹配研究[J].现代图书情报技术,2013(9):15-22. 被引量：10
3于静,刘燕兵,张宇,刘梦雅,谭建龙,郭莉.大规模图数据匹配技术综述[J].计算机研究与发展,2015,52(2):391-409. 被引量：36
4周兰花,付彬,李仁发,刘新忠,黄晶.基于异构计算的三维FDTD并行算法及其在电磁仿真中的应用[J].计算机工程与科学,2017,39(7):1241-1248. 被引量：4
5沙立成,张岩,张璇,郭冬山,王海霞,胡军,雷一鸣.电网多维异构数据融合三维可视化方法[J].自动化与仪器仪表,2017(7):201-203. 被引量：7
6谢伟康,赵罡,于勇,王耀东.基于特征的异构全三维数字化模型转换方法研究与实现[J].计算机集成制造系统,2017,23(9):1833-1841. 被引量：12
7钱庆松.基于异构多核可重构系统的矩阵求逆设计与实现[J].舰船电子工程,2017,37(10):37-41. 被引量：1
8张开兴,杭晟煜,王金星,宋正河,刘贤喜.基于模拟退火的三维模型典型结构挖掘与相似性评价[J].农业机械学报,2018,49(3):402-410. 被引量：7
9李贺,李晓琳.基于语义匹配的海量异构数据自动化集成方法研究[J].软件导刊,2018,17(4):194-196. 被引量：6

引证文献2

1张磊,刘渊,朱建明.公路桥梁多年度年报数据跟踪匹配模型研究[J].交通世界,2018(35):12-14. 被引量：1
2张卓.基于顶点相容程度矩阵的异构三维CAD模型检索方法[J].周口师范学院学报,2019,36(5):105-107.

二级引证文献1

1敖盛,徐岚,敖清文.NLP中文分词技术在桥梁报告数据处理中的应用[J].交通世界,2020(17):3-5. 被引量：2

1赵夫群,周明全,耿国华.基于轮廓曲线和特征区域的秦俑碎块匹配算法[J].北京理工大学学报,2018,38(3):293-299. 被引量：12
2周炳良,邓立新,洪民江.一种新的基于DTW的孤立词语音识别算法[J].计算机技术与发展,2018,28(4):119-123. 被引量：7
3梁田,仲晓娟.中国外语学科研究热点及其演化(2002-2016)——基于关键词共现网络的可视化分析[J].鄂州大学学报,2018,25(3):51-53. 被引量：1
4谢志强,张晓欢,辛宇,杨静.考虑后续工序的择时综合调度算法[J].自动化学报,2018,44(2):344-362. 被引量：14
5付志雄,张雪芳.基于SOA架构的内容管理平台系统分析与设计[J].机电产品开发与创新,2018,31(3):108-109. 被引量：2
6闫璐.中国铁道科学研究院2016年度科技成果简介(续四)[J].中国铁道科学,2018,39(3):7-7.
7聂永丹,赵丹,郜立国.基于姿势特征编码的运动数据分层检索[J].吉林大学学报（信息科学版）,2017,35(4):410-417.
8赵夫群,耿国华.基于特征的刚体碎块断裂面层次化匹配方法[J].科学技术与工程,2018,18(10):90-94.
9赵斌.基于关键词教学法的高中生史料实证素养的培养策略——以人民版“古代中国的农业经济”为例[J].新校园（中旬刊）,2018,0(3):129-130.
10谢志强,张晓欢,高一龙,辛宇.考虑串行工序紧密度的择时综合调度算法[J].机械工程学报,2018,54(6):191-202. 被引量：11

沈阳航空航天大学学报

2018年第2期

浏览历史

内容加载中请稍等...

基于匹配的异构数据索引方法被引量：2

参考文献5

二级参考文献38

共引文献88

同被引文献9

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于匹配的异构数据索引方法 被引量：2

参考文献5

二级参考文献38

共引文献88

同被引文献9

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于匹配的异构数据索引方法被引量：2