期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于条件随机场的中文地址要素识别方法 被引量:20
1
作者 蒋文明 张雪英 李伯秋 《计算机工程与应用》 CSCD 北大核心 2010年第13期129-131,共3页
由于中文地址命名的不规范性和汉语语言特点,中文地址要素识别成为地址编码的关键技术。传统的特征字匹配和字典匹配方法,难以解决地址要素命名的多样性问题。借鉴自然语言处理技术,通过构建地址要素标注集,设计了基于条件随机场的中文... 由于中文地址命名的不规范性和汉语语言特点,中文地址要素识别成为地址编码的关键技术。传统的特征字匹配和字典匹配方法,难以解决地址要素命名的多样性问题。借鉴自然语言处理技术,通过构建地址要素标注集,设计了基于条件随机场的中文地址要素识别方法。实验证明,与基于特征字的规则方法相比,基于条件随机场的方法能够在较大程度上提高识别效果。由于条件随机场模型具有较好的泛化能力,该方法具有更强的通用性,特别适宜于大规模地址数据的批量解析和大众化位置服务中地址编码的快速处理。 展开更多
关键词 地址编码 中文地址要素 自然语言处理 条件随机场
在线阅读 下载PDF
多源地址要素可信度评估——以道路要素为例 被引量:1
2
作者 孙立财 陈以松 +2 位作者 熊杰 罗安 王勇 《测绘通报》 CSCD 北大核心 2021年第10期108-113,共6页
随着自发地理信息和中文地址要素切分技术的发展,地址要素的质量有待评价。本文针对中文地址文本切分产生的地址要素质量难以有效评价的问题,提出了一种多源数据和网络检索支持下的地址要素可信度评估方法。首先利用中文分词工具对地址... 随着自发地理信息和中文地址要素切分技术的发展,地址要素的质量有待评价。本文针对中文地址文本切分产生的地址要素质量难以有效评价的问题,提出了一种多源数据和网络检索支持下的地址要素可信度评估方法。首先利用中文分词工具对地址要素进行分词与词性标注,通过分析词频和词性组合模式,对地址要素的命名结构进行可信度计算。其次基于大规模的地址样本、道路数据及POI数据,挖掘多源数据对地址要素的数据支撑,计算数据支持度。然后利用搜索引擎对地址要素进行快速检索,分析搜索结果与数量,对地址要素的网络可信度进行计算。最后提出一种地址要素综合可信度计算模型,实现地址要素的综合可信度计算。试验结果表明,该模型与方法不仅能够高效快速地计算中文地址文本中地址要素的可信度,还能够有效发现地址要素中存在的偏僻、虚假等相关问题,为地址要素的自动化检测与标准化处理提供参考。 展开更多
关键词 多源数据 地址要素 可信度评估 中文分词 归一化
在线阅读 下载PDF
基于标志词的正向自适应长度匹配的地址分词算法与缺失地址要素补充方法 被引量:1
3
作者 李净 朱贵鲜 +1 位作者 周亮 郑西川 《中国医疗设备》 2019年第4期112-114,130,共4页
目的将电子病历中患者的非结构化地址信息转化成结构化地址信息,并补充地址中缺失的地址要素。方法构建存储标准地址数据集的标准地址库和自定义的地址匹配规则库。依托标准地址库,采用基于地址要素标志的正向自适应匹配算法将地址进行... 目的将电子病历中患者的非结构化地址信息转化成结构化地址信息,并补充地址中缺失的地址要素。方法构建存储标准地址数据集的标准地址库和自定义的地址匹配规则库。依托标准地址库,采用基于地址要素标志的正向自适应匹配算法将地址进行分词。将分词得到的地址要素根据构建的自定义地址匹配规则库从后往前查找,得到完整的地址。结果该方法实现了病历中地址数据的自动分词,同时补充了地址数据中缺失的地址要素,完成地址标准化的工作。结论本研究极大地方便了临床病案首页中地址信息的自动获取、各类机构数据上报和数据统计分析工作,大幅减少人工数据处理的工作量,为后续其他信息的提取和标化打下坚实基础。 展开更多
关键词 地址分词 正向自适应长度匹配 缺失地址要素补充 结构化地址
在线阅读 下载PDF
多元地址要素组合的地址匹配方法 被引量:9
4
作者 吕欢欢 宋伟东 《测绘科学》 CSCD 北大核心 2015年第3期96-100,共5页
针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对... 针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对地址要素的不同重要程度分配权重,计算不同组合中各地址要素相似性匹配指数,并采用加权求和方式获得匹配总分;并以城市地址编码数据库为参考数据,工商领域监管对象地名地址数据为输入地址对提出方法进行实验和验证,与其他匹配算法对比的结果表明,提出算法有效、正确、灵活。 展开更多
关键词 数字城市 地址匹配 多元地址要素 地址分词 组合
原文传递
一种顾及地理实体知识的中文地址要素解析方法 被引量:2
5
作者 杨彬 罗安 +1 位作者 王勇 李朋朋 《测绘科学》 CSCD 北大核心 2023年第9期202-211,共10页
针对当前中文地址要素解析方法复杂度高,且经常忽略细粒度地址要素语义特征的问题,该文提出一种顾及地理实体知识的中文地址要素解析方法。该方法结合现有地址要素分类分级框架:(1)扩展中文地址表达模型,丰富细粒度地址要素的语义特征表... 针对当前中文地址要素解析方法复杂度高,且经常忽略细粒度地址要素语义特征的问题,该文提出一种顾及地理实体知识的中文地址要素解析方法。该方法结合现有地址要素分类分级框架:(1)扩展中文地址表达模型,丰富细粒度地址要素的语义特征表示;(2)设计顾及语义信息的五词位标注方法对地址进行标注,并使用小规模标注语料对ERNIE模型参数进行微调;(3)基于条件随机场模型计算标签组合概率并进行分析推理,利用两种学习策略进一步提升模型的解析性能。通过实验验证与对比分析,该文提出的方法获得的F1值超过97%,同时也大幅度减少了训练时间,其综合性能显著优于现有地址要素解析方法。 展开更多
关键词 地址要素解析 ERNIE模型 地址模型扩展 无监督学习
原文传递
城市地址要素组合模式分析——以深圳市为例 被引量:1
6
作者 叶鹏 张雪英 王铁 《测绘科学》 CSCD 北大核心 2022年第2期192-199,共8页
为了深入探测城市地址数据对于地理位置表达的描述特点,该文提出一种城市地址要素组合模式的分析方法。在构建城市地址要素多级分类体系的基础上,通过标注地址语料归纳规则模型进行地址要素解析,进一步分析城市地址中各类要素的组合模... 为了深入探测城市地址数据对于地理位置表达的描述特点,该文提出一种城市地址要素组合模式的分析方法。在构建城市地址要素多级分类体系的基础上,通过标注地址语料归纳规则模型进行地址要素解析,进一步分析城市地址中各类要素的组合模式。以深圳市1700多万条地址数据为例,分析出使用频率最高的17种地址要素组合模式。期望研究结果在我国城市地址资源的标准制定、规范化建设和智能服务等方面得以应用。 展开更多
关键词 城市地址 地址要素 组合模式 深圳市
原文传递
一种基于深度学习模型的中文地址解析方法
7
作者 王菁 张睿轩 +1 位作者 邓欣颖 林浩然 《北方工业大学学报》 2024年第5期30-38,共9页
地址是我国城市数字化建设的重要空间资源和战略性基础信息资源,经解析处理后可应用在多个领域,因此提升地址解析的准确性十分必要。针对以上问题,本文提出一种基于深度学习模型的中文地址解析方法。该方法首先使用预训练语言模型来获... 地址是我国城市数字化建设的重要空间资源和战略性基础信息资源,经解析处理后可应用在多个领域,因此提升地址解析的准确性十分必要。针对以上问题,本文提出一种基于深度学习模型的中文地址解析方法。该方法首先使用预训练语言模型来获取动态词向量,并利用双向门控循环单元的序列建模能力和卷积神经网络的平移不变性提取文本中的上下文语义特征;随后引入层归一化规范模型训练过程中的特征分布,再添加多头注意力机制使模型能够更有效地聚焦关键信息;最后引入条件随机场用于全局标注序列的学习和解码,完成中文地址解析任务。实验结果表明,所提模型在中文地址解析任务中的精确率、召回率和F1值均高于其他对比中文地址解析模型。 展开更多
关键词 地址解析 地址要素分类 地址解析模型 预训练语言模型 双向门控循环单元
在线阅读 下载PDF
基于RoBERTa-BiLSTM-SelfAttention-CRF的中文地址解析方法
8
作者 苗佳池 陈颖 +2 位作者 生龙 魏忠诚 王巍 《河北省科学院学报》 CAS 2024年第6期25-34,共10页
针对中文地址解析精准度不高、效率低以及忽略细粒度地址要素等问题,提出融合自注意力机制的RoBERTa-BiLSTM-SelfAttention-CRF的中文地址解析方法。首先,利用RoBERTa提取地址文本的深层语义特征和丰富的上下文信息;其次,通过BiLSTM网... 针对中文地址解析精准度不高、效率低以及忽略细粒度地址要素等问题,提出融合自注意力机制的RoBERTa-BiLSTM-SelfAttention-CRF的中文地址解析方法。首先,利用RoBERTa提取地址文本的深层语义特征和丰富的上下文信息;其次,通过BiLSTM网络建模地址文本的序列关系,捕捉地址要素之间的关系依赖;然后,在不同地址要素之间引入自注意力机制建立有效关联,优化模型在解析中文地址时的表现;最后,采用CRF标注地址序列,实现精确的地址解析。实验结果表明,自注意力机制的引入有助于提升中文地址解析效果,该方法在自建数据集上,准确率为0.9594,召回率为0.9697,F1值为0.9645。在CCKS2021公开数据集上,准确率为0.9080,召回率为0.9158,F1值为0.9119,较目前先进方法F1值提升0.0069,表现出良好的性能及泛化能力。 展开更多
关键词 中文地址解析 地址要素 RoBERTa BiLSTM CRF 自注意力机制
在线阅读 下载PDF
地址编码关键技术——地址数据内容规范研究 被引量:11
9
作者 佟文会 江洲 李小林 《标准科学》 CSSCI 2009年第11期39-42,共4页
文章阐述了地址数据内容规范的需求分析,分析了国外地址数据分类与编码和标准规范方面的研究方法和成果,总结了国内已有的工作基础和存在的一些问题。提出了适合我国自身特点的地址数据内容规范,首先定义地址要素的概念,给出基本地址名... 文章阐述了地址数据内容规范的需求分析,分析了国外地址数据分类与编码和标准规范方面的研究方法和成果,总结了国内已有的工作基础和存在的一些问题。提出了适合我国自身特点的地址数据内容规范,首先定义地址要素的概念,给出基本地址名称及常用地址通名;总结了几种常见的地址数据名称;提出了地址描述规则。 展开更多
关键词 地址数据 地址要素 地址描述规则
在线阅读 下载PDF
重庆市标准地址模型与地址库研究与实践 被引量:8
10
作者 李莉 丁忆 周建 《地理信息世界》 2014年第4期83-88,共6页
结合重庆山地城市特点,研究了重庆标准地址要素分类、组合模式及层次关系。基于此模型对覆盖重庆主城600平方千米的40万条地址数据进行分词、分层,建设地址数据库。在应用方面,对卫生、教育、事业单位等行业专题数据进行地址匹配,为政... 结合重庆山地城市特点,研究了重庆标准地址要素分类、组合模式及层次关系。基于此模型对覆盖重庆主城600平方千米的40万条地址数据进行分词、分层,建设地址数据库。在应用方面,对卫生、教育、事业单位等行业专题数据进行地址匹配,为政务地理信息提供良好的服务支撑。 展开更多
关键词 标准地址 地址要素 组合模式 地址匹配 门址
在线阅读 下载PDF
浅谈城市地址编码数据库的建立 被引量:6
11
作者 万剑华 叶海波 《工程勘察》 CSCD 北大核心 2009年第11期73-76,共4页
地址编码数据库的建立是地址编码技术的重要基础,本文详细论述了地址编码数据库建立的过程,主要包括地址数据的标准化、数据库的总体设计及数据采集与更新三个部分,其中总体设计部分重点讲述了地址编码数据库的四层逻辑结构、系统建立... 地址编码数据库的建立是地址编码技术的重要基础,本文详细论述了地址编码数据库建立的过程,主要包括地址数据的标准化、数据库的总体设计及数据采集与更新三个部分,其中总体设计部分重点讲述了地址编码数据库的四层逻辑结构、系统建立的数据流程图和地址数据库的表结构,最后介绍了地址编码数据库在实际中的应用。同时,结合国内现状,提出了若干建议。 展开更多
关键词 地址编码 数据库 地址要素 地址模型
在线阅读 下载PDF
一种适于地理编码的地址数据规范化方法 被引量:3
12
作者 彭颖霞 吴升 《测绘科学技术学报》 CSCD 北大核心 2013年第5期521-524,共4页
地址数据的规范化表达是地理编码的前提。首先,通过设计地址要素层次模型,建立地址要素词典库,并存储地址要素名称、地址通名、地址专名、地址要素类型编码等,用于地址要素拆分;其次,采用首次取两个字、再逐次加一字的地址通名切分方法... 地址数据的规范化表达是地理编码的前提。首先,通过设计地址要素层次模型,建立地址要素词典库,并存储地址要素名称、地址通名、地址专名、地址要素类型编码等,用于地址要素拆分;其次,采用首次取两个字、再逐次加一字的地址通名切分方法对原始地址数据进行地址要素拆分和规范化,弥补了常用的最大正向分词算法中M系数难以确定的不足,避免了没有意义的循环,提高了查找效率和准确率。最后,基于地址要素组合规则对拆分后的地址要素进行重构获得规范化的地址。 展开更多
关键词 地理编码 地址要素 地址规范化 地址数据 地址专名
在线阅读 下载PDF
基于规则与词典的地址匹配算法 被引量:10
13
作者 赵英 占斌斌 +1 位作者 贾沛哲 李华英 《北京测绘》 2017年第5期50-54,共5页
针对现有中文地名匹配算法匹配核心地址要素不明确,准确性不足的问题,本文提出了一种基于规则与词典相结合的地址匹配算法。该算法通过地址要素特征词来对地址要素进行初识别,利用地址要素词典对可能的地址要素进行匹配,通过遍历词典得... 针对现有中文地名匹配算法匹配核心地址要素不明确,准确性不足的问题,本文提出了一种基于规则与词典相结合的地址匹配算法。该算法通过地址要素特征词来对地址要素进行初识别,利用地址要素词典对可能的地址要素进行匹配,通过遍历词典得到所有可能的地址要素,对各类地址要素进行组合得到最有效地址要素,利用最有效地址要素进行地址匹配与定位。利用该算法对高德地图随机抽取的1800条POI数据进行了匹配验证,实验结果表明该算法在匹配效率和准确性两方面均有较大提升。 展开更多
关键词 地名 地址要素 地址模型 地址匹配
在线阅读 下载PDF
基于BERT-BiLSTM-CRF的中文地址解析方法 被引量:9
14
作者 吴恪涵 张雪英 +2 位作者 叶鹏 怀安 张航 《地理与地理信息科学》 CSCD 北大核心 2021年第4期10-15,共6页
中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面。但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题。为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基... 中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面。但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题。为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基于BERT-BiLSTM-CRF深度学习模型的中文地址解析方法:依据中文地址要素多级分类体系,扩展BIOES标注方法并进行地址语料标注;基于预训练语言模型,构建融合BERT、BiLSTM和CRF的综合深度学习模型,通过BERT预训练语言模型获取富含语义信息的字符向量,弥补静态词向量特异性缺失的问题,提高复杂地址要素的提取能力。以2019年深圳市地址数据为例进行模型性能评估,该方法对于多数中文地址要素的解析准确率达90%以上;相比IDCNN-CRF和BiLSTM-CRF等深度学习模型,该方法对只具有小规模地址语料时的地址解析效果更优,且在解析多种地址要素类型时能保持良好的性能。 展开更多
关键词 中文地址 地址要素分类 地址标注 BERT-BiLSTM-CRF 地址解析模型
在线阅读 下载PDF
用于地址(地理位置)匹配的关键路径法 被引量:5
15
作者 钱敏 顾国强 鲁明 《计算机应用与软件》 CSCD 北大核心 2012年第1期211-214,219,共5页
中文地址的编码和匹配是数字化描述空间位置的基本手段,由于中文地址表达的多样性而导致同一地理位置的描述结果千差万别。在Web地图应用中,如何解析使用者输入的地址、转换成标准化地址,一直是个难点。采用地名词典和标准地址库为数据... 中文地址的编码和匹配是数字化描述空间位置的基本手段,由于中文地址表达的多样性而导致同一地理位置的描述结果千差万别。在Web地图应用中,如何解析使用者输入的地址、转换成标准化地址,一直是个难点。采用地名词典和标准地址库为数据源,构造分词词典表,设计了基于逆向扫描和特征词结合的中文地址匹配模型,并提出了基于权重的地址关键路径的判定方法,较好地解决了中文地址表达多样性与地理位置唯一性问题。 展开更多
关键词 地址匹配 关键路径 唯一性 地址要素
在线阅读 下载PDF
湛江市地名地址数据库设计与实现 被引量:9
16
作者 马学峰 《测绘通报》 CSCD 北大核心 2014年第S2期288-291,共4页
随着湛江市地理信息服务平台的建立,其核心数据库需进一步进行完善。基于全要素基础地形图、影像数据、地质、规划、管线信息和基础地名数据,构建地名地址数据库,为湛江市地理信息服务平台电子地图提供基础地理信息框架信息。本文论述... 随着湛江市地理信息服务平台的建立,其核心数据库需进一步进行完善。基于全要素基础地形图、影像数据、地质、规划、管线信息和基础地名数据,构建地名地址数据库,为湛江市地理信息服务平台电子地图提供基础地理信息框架信息。本文论述了地名地址模型构建、编码原则,数据库设计及更新,并介绍地名数据库的应用情况。 展开更多
关键词 地址要素 地名 数据库
在线阅读 下载PDF
基于伪语义相似度模型的中文地址匹配方法 被引量:3
17
作者 郁汀 王铎 陈钦 《测绘通报》 CSCD 北大核心 2022年第3期101-106,共6页
地址匹配中,由于传统相似度模型受字符重叠数影响大,在处理简写、缩写地址要素单元时,错误匹配问题突出;深度学习方法需要大量样本支撑,但庞大的数据量和多样的形式,导致生成样本的成本过高。为解决上述问题,本文首先应用基于条件随机... 地址匹配中,由于传统相似度模型受字符重叠数影响大,在处理简写、缩写地址要素单元时,错误匹配问题突出;深度学习方法需要大量样本支撑,但庞大的数据量和多样的形式,导致生成样本的成本过高。为解决上述问题,本文首先应用基于条件随机场和双向长短时记忆神经网络的模型,对地址进行分词;然后通过建立一种伪语义相似度,对地址要素进行分级匹配。通过对公安业务中地址数据进行测试,在对缩写、简写等不规范地址描述方面,本文模型能较理想地完成任务,各参考指标均高于0.9。 展开更多
关键词 条件随机场和双向长短时记忆神经网络 地址要素解析 伪语义相似度 地址匹配 地址标准化
在线阅读 下载PDF
基于FME的地址数据标准化关键技术研究与实现 被引量:5
18
作者 余远剑 《测绘与空间地理信息》 2017年第11期53-55,共3页
地址数据标准化是标准地址库建设的重要环节。本文研究了地址数据标准化的数据转换、要素分级、地址编码等关键技术及其基于FME的技术实现,并将其应用于标准地址库建设,实现了海量地址数据的批量标准化处理。
关键词 地址要素 地址标准化 正则匹配
在线阅读 下载PDF
北京市地理编码数据库的研究 被引量:44
19
作者 李军 李琦 +1 位作者 毛东军 郭玲玲 《计算机工程与应用》 CSCD 北大核心 2004年第2期1-3,6,共4页
文章在分析国内外地理编码现状的基础上,重点研究了北京的地址现状,认为北京市的地址模型是一种复杂的层次模型。根据这种模型,提出了最小地址要素的概念,并用随机无意义唯一码对地址进行编码。文章在理论上解决了长期困扰中国地理编码... 文章在分析国内外地理编码现状的基础上,重点研究了北京的地址现状,认为北京市的地址模型是一种复杂的层次模型。根据这种模型,提出了最小地址要素的概念,并用随机无意义唯一码对地址进行编码。文章在理论上解决了长期困扰中国地理编码进程的一些问题,为地理编码的现实应用奠定了基础。 展开更多
关键词 地理编码 地址模型 地址要素
在线阅读 下载PDF
自然语言理解的中文地址匹配算法 被引量:29
20
作者 宋子辉 《遥感学报》 EI CSCD 北大核心 2013年第4期788-801,共14页
在分析现有3类主要的中文地址匹配算法:要素层级匹配法、全文检索法、正则表达式法的基础上,提出了基于自然语言理解的中文地址匹配算法。新算法中建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间... 在分析现有3类主要的中文地址匹配算法:要素层级匹配法、全文检索法、正则表达式法的基础上,提出了基于自然语言理解的中文地址匹配算法。新算法中建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间知识表达问题。新算法的完整流程包括预处理、地址解析、地址要素标准化、推理匹配和匹配登记等5个环节,本文重点阐述了地址解析和推理匹配这两个重要环节,分别依据"自然语言理解"中的中文分词和语义推理原理,对用非结构化的中文自然语言描述的中文地址进行处理,实现自然语言理解方法与地址匹配之间的结合,从而建立完整的基于自然语言理解的中文地址匹配算法。为验证该算法,开发了中文地址智能匹配实验系统,对河南省濮阳市人口库1000条居民地址数据进行匹配,匹配率达到了95%,准确率高于93%。 展开更多
关键词 自然语言理解 地址匹配 地址要素 地址解析 隐马尔科夫模型
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部