期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
基于2010—2022年专利无效宣告数据的中国专利文本质量发展动态研究 被引量:1
1
作者 李莉 张晓东 徐敏 《中国发明与专利》 2024年第3期46-53,共8页
本文选取申请年为2010年至2022年的专利,以智慧芽数据库为无效宣告数据来源,对其中被提起无效的专利进行统计分析。采用静态分析与动态分析相结合的方式,剖析中国专利文本质量的发展动态。本文从无效决定结果、IPC分类和无效宣告理由三... 本文选取申请年为2010年至2022年的专利,以智慧芽数据库为无效宣告数据来源,对其中被提起无效的专利进行统计分析。采用静态分析与动态分析相结合的方式,剖析中国专利文本质量的发展动态。本文从无效决定结果、IPC分类和无效宣告理由三个维度进行统计分析。静态分析是从全局角度披露中国专利文本质量状况;动态分析则是以时间为横坐标轴,细化分析专利撰写中的各类质量缺陷的发展动态。在无效宣告数据的基础上,探索数据背后的外部环境影响因素,帮助理清在现阶段有哪些是提升中国专利文本质量的关键环节。 展开更多
关键词 无效宣告理由 专利无效宣告程序 专利文本质量
在线阅读 下载PDF
ESG报告文本质量对ESG评级分歧的影响
2
作者 张馨予 《财务与金融》 2024年第3期40-50,共11页
作为衡量上市公司ESG表现的重要指标,第三方评级机构发布的ESG评级受到了利益相关者的广泛关注。然而,不同评级机构对于同一家公司的ESG评级存在分歧,导致利益相关者难以准确了解公司真实的ESG表现。作为评级机构的重要信息来源,ESG报... 作为衡量上市公司ESG表现的重要指标,第三方评级机构发布的ESG评级受到了利益相关者的广泛关注。然而,不同评级机构对于同一家公司的ESG评级存在分歧,导致利益相关者难以准确了解公司真实的ESG表现。作为评级机构的重要信息来源,ESG报告的文本质量会影响评级机构对公司ESG表现的判断,进而影响评级分歧。以2018-2022年我国A股上市公司为样本,运用文本分析技术从语调、可读性、报告长度、前瞻性信息四个文本语言特征的角度构建上市公司ESG报告文本质量指标,探究ESG报告文本质量对ESG评级分歧的影响。研究发现,ESG报告文本质量越高,ESG评级分歧越小。进一步分析发现,ESG报告的语调越消极、可读性越强、长度越长、前瞻性信息越多,ESG评级分歧就越小。此外,ESG报告文本质量的提高对环境、社会责任和公司治理等不同维度的评级分歧均有显著抑制作用;相较于自愿披露,强制披露下ESG报告文本质量的提高对ESG评级分歧的抑制作用更为显著。因此,上市公司应高度重视ESG报告的文本质量,确保ESG报告逻辑清晰、易于理解、内容详实且具有前瞻性;监管机构应扩大强制披露ESG报告的上市公司范围,并加强对ESG报告文本质量的监管。 展开更多
关键词 ESG披露 ESG评级分歧 文本质量 ESG报告
在线阅读 下载PDF
新建地方本科院校毕业论文文本质量调查研究 被引量:2
3
作者 伍汝辉 《当代教育理论与实践》 2015年第11期105-107,共3页
本科毕业论文是大学阶段最后一个教学环节,在培养大学生探求真理、进行科学研究基本训练、提高综合实践能力等方面有重要作用。本研究以我国8所新建地方本科院校2011~2014届800份本科毕业论文为调查对象,就其符合国家标准《科学技术报... 本科毕业论文是大学阶段最后一个教学环节,在培养大学生探求真理、进行科学研究基本训练、提高综合实践能力等方面有重要作用。本研究以我国8所新建地方本科院校2011~2014届800份本科毕业论文为调查对象,就其符合国家标准《科学技术报告、学位论文和学术论文的编写格式》情况进行调查分析,结果显示,在“摘要内容编写规范”“文献综述必备”“结论内容编写规范”和“注释与参考文献编写规范”上亟待提高。 展开更多
关键词 本科毕业论文 文本质量 文献调查
在线阅读 下载PDF
报纸新闻文本质量评估指标体系研究 被引量:1
4
作者 肖云 《中华文化论坛》 北大核心 2017年第11期58-69,共12页
本文主要研究了报纸新闻文本的评价问题。新闻文本主要通过真实性、新鲜性、实用性和正义性四大特征所构成的指标来评价。这四个指标每一个指标都可以分解为两级指标,利用层次分析法,把这两级指标整合起来,就构成了新闻文本的评价指标... 本文主要研究了报纸新闻文本的评价问题。新闻文本主要通过真实性、新鲜性、实用性和正义性四大特征所构成的指标来评价。这四个指标每一个指标都可以分解为两级指标,利用层次分析法,把这两级指标整合起来,就构成了新闻文本的评价指标体系。其中,正义性指标往往无法进行即时性评价,只有在社会效应产生以后才能对这一指标做出更准确的评价。但从逻辑上说,这一指标是缺一不可的。 展开更多
关键词 新闻文本质量 质量评估 层次分析法
原文传递
基于文本质量的文献检索结果的系统聚类
5
作者 王筠 孙晓雅 刘军 《情报理论与实践》 CSSCI 北大核心 2012年第10期115-117,共3页
采用系统聚类的方法对文献数据库的检索结果按其质量进行聚类,并通过实例说明这种方法的可行性和有效性。检索结果经过聚类方法处理后,用户可迅速了解检索结果的质量等级分布,从而对不同等级的检索结果采用不同的阅读方式。这样便能节... 采用系统聚类的方法对文献数据库的检索结果按其质量进行聚类,并通过实例说明这种方法的可行性和有效性。检索结果经过聚类方法处理后,用户可迅速了解检索结果的质量等级分布,从而对不同等级的检索结果采用不同的阅读方式。这样便能节省用户的阅读时间,提高检索效率。该项研究对今后开发针对检索结果的文本聚类插件奠定了基础。 展开更多
关键词 文本质量 文本分类 检索结果 系统聚类
原文传递
旅游网站英文文本质量调查:问题与对策--以安徽省英文旅游网站为例
6
作者 陶全胜 《安徽理工大学学报(社会科学版)》 2016年第2期73-77,共5页
旅游业作为新兴的朝阳产业在国民经济中的贡献比例逐年增长,为拓宽海外市场,更好地促进旅游业健康发展,与旅游相关的企事业单位纷纷创建英文网站。但目前国内旅游网站英文文本制作方面存在不少问题,其具体表现为:语法性错误、语义表达... 旅游业作为新兴的朝阳产业在国民经济中的贡献比例逐年增长,为拓宽海外市场,更好地促进旅游业健康发展,与旅游相关的企事业单位纷纷创建英文网站。但目前国内旅游网站英文文本制作方面存在不少问题,其具体表现为:语法性错误、语义表达不清、修辞性偏差等语言表达方面的失误;文内连贯不强、信息整合力度不够、忽视现代信息技术手段的使用等信息构建方面的失误。为进一步提升中国入境旅游的形象,必须强化语言服务责任,提高文本制作的质量意识;充分认识建好英文网站的意义,加强对文本制作的监管。 展开更多
关键词 英文旅游网站 文本质量 问题 对策
在线阅读 下载PDF
电力设备缺陷文本质量保证与评级软件的开发及应用 被引量:5
7
作者 李彦儒 王慧芳 +3 位作者 陈昊 张佳丽 江帆 谢雅雯 《浙江电力》 2022年第7期78-85,共8页
针对电力设备缺陷文本质量保证和评级工作缺少智能化工具的问题,开发基于标准和历史缺陷的电力设备缺陷文本质量保证与评级软件。首先,进行软件需求分析,确定软件要实现文本质量分析和缺陷自动评级的主要功能,针对标准和历史缺陷两类研... 针对电力设备缺陷文本质量保证和评级工作缺少智能化工具的问题,开发基于标准和历史缺陷的电力设备缺陷文本质量保证与评级软件。首先,进行软件需求分析,确定软件要实现文本质量分析和缺陷自动评级的主要功能,针对标准和历史缺陷两类研究依据的特点设计了两种使用流程。然后,介绍了关键功能模块的详细程序设计过程,其中基于标准的文本质量分析和缺陷自动评级采用标准树匹配的方法,基于历史缺陷的文本质量分析和缺陷自动评级采用基于知识图谱进行图检索的方法。最后,用算例展示了软件的运行效果,结果表明,该软件通过交互方式实现了输入缺陷文本的质量智能管控和自动评级功能,为电力设备缺陷闭环管理和运检智能化水平的提升提供了有力支撑。 展开更多
关键词 电力设备缺陷文本 软件开发 缺陷分类标准 文本质量分析 缺陷自动评级
在线阅读 下载PDF
党内法规文本质量实证研究——以221部党内法规为分析样本 被引量:10
8
作者 罗有成 《理论导刊》 北大核心 2020年第4期34-40,共7页
文本质量是党内法规的生命,攸关从严治党、依规治党的制度根基。对党内法规文本统计分析表明,党内法规文本呈现逐年递增、增长迅速以及条款类型较少、重实体轻程序、义务主导等特点。通过类型化分析发现,党内立规中"党言党语"... 文本质量是党内法规的生命,攸关从严治党、依规治党的制度根基。对党内法规文本统计分析表明,党内法规文本呈现逐年递增、增长迅速以及条款类型较少、重实体轻程序、义务主导等特点。通过类型化分析发现,党内立规中"党言党语"与"法言法语"并存,形式上表现为模糊性与精确性的冲突,实质上是政治性与规范性的冲突。制定体制不完善和技术规范缺失导致立规语言模糊、内容混乱、程序缺位,甚至出现机械化照搬国家法律体系经验的问题。在提升文本质量过程中,只有坚持立规语言精确化、立规内容体系化和立规程序完善化,进一步促进政治性与规范性的平衡,党内法规才能将制度优势转化为治理效能,让铁规发力、让禁令生威。 展开更多
关键词 党内法规 文本质量 模糊性 精确性
在线阅读 下载PDF
面向主流价值观的文本质量评价研究 被引量:1
9
作者 崔丁洁 徐冰 《智能计算机与应用》 2023年第5期197-202,F0003,共7页
针对面向主流价值观的文本质量评价这一全新且较为复杂的任务,本文依据主流价值观对文本质量进行定义,构建了一个面向主流价值观的文本质量评价数据集。为了缓解人工标注数据的压力以及解决域内数据获取困难的问题,提出了一个基于无监... 针对面向主流价值观的文本质量评价这一全新且较为复杂的任务,本文依据主流价值观对文本质量进行定义,构建了一个面向主流价值观的文本质量评价数据集。为了缓解人工标注数据的压力以及解决域内数据获取困难的问题,提出了一个基于无监督数据增强框架的文本质量评价方法。实验证明,在数据量较小时,能显著提升模型性能。为了获取更多数据,自主构建了一个大规模中文微博检索库,通过检索对数据集进行扩充。最终模型的F1值达到86.2%,相比BERT提升1.22%。 展开更多
关键词 文本质量评价 主流价值观 半监督学习
在线阅读 下载PDF
董秘兼任CFO会提高年报文本信息质量吗?——基于文本语调操纵的经验证据
10
作者 卜小霞 王甜甜 《中国注册会计师》 北大核心 2025年第2期58-66,共9页
本文基于文本语调操纵视角,考察了董秘兼任CFO对年报文本信息质量的影响。研究发现,董秘兼任CFO能够抑制上市公司的年报文本语调操纵,提高文本信息质量。进一步发现,董秘兼任CFO主要通过提高信息沟通效率和增强外部监督发挥作用。此外,... 本文基于文本语调操纵视角,考察了董秘兼任CFO对年报文本信息质量的影响。研究发现,董秘兼任CFO能够抑制上市公司的年报文本语调操纵,提高文本信息质量。进一步发现,董秘兼任CFO主要通过提高信息沟通效率和增强外部监督发挥作用。此外,操控性应计水平越高,董秘兼任CFO对年报文本语调操纵的抑制作用越小。基于董秘异质性特征检验发现,中年和老年董秘兼任CFO能显著抑制文本语调操纵,且老年董秘的抑制作用最强,青年董秘则没有显著影响。 展开更多
关键词 董秘CFO 董秘兼任CFO 文本信息质量 语调操纵
在线阅读 下载PDF
生成式摘要的事实一致性与文本质量的平衡性研究
11
作者 杨昱睿 何禹瞳 琚生根 《四川大学学报(自然科学版)》 2025年第2期347-358,共12页
事实一致性的提升已成为生成式摘要领域的一个研究热点,目前的主流方法可分为后编辑和模型机制优化两类.现有的方法虽然有效地提升了事实一致性,但基本上牺牲了文本质量,降低了可读性.针对这个问题,提出了一种结合强化学习与基于排序的... 事实一致性的提升已成为生成式摘要领域的一个研究热点,目前的主流方法可分为后编辑和模型机制优化两类.现有的方法虽然有效地提升了事实一致性,但基本上牺牲了文本质量,降低了可读性.针对这个问题,提出了一种结合强化学习与基于排序的对比学习的生成式摘要模型SumRCL.一方面,本文利用基于候选摘要排序的对比学习来提升模型对摘要赋予的概率与该摘要的事实一致性的相关度;另一方面,还使用基于文本质量评估指标的强化学习来保留高度文本质量,其中采用了蒙特卡罗搜索方法来解决中间摘要的评估问题.本文方法在CNN/DM与XSUM数据集上的实验表明,本文提出的SumRCL模型确实有助于生成事实一致性与文本质量都很高的摘要,并分析了对比学习中候选摘要数量和排序指标对最终效果的影响.最后,本文通过人工评估展现了SumRCL比如今流行的大语言模型具有更好的事实性行为. 展开更多
关键词 事实一致性 文本质量 强化学习 对比学习 SumRCL模型 CNNDM数据集 XSUM数据集 摘要生成
在线阅读 下载PDF
基于内在质量约束的文本生成和评价综述 被引量:1
12
作者 兰玉乾 饶元 +3 位作者 李冠呈 孙菱 夏昺灿 辛婷婷 《电子学报》 EI CAS CSCD 北大核心 2024年第2期633-659,共27页
近年来,以ChatGPT为代表的能够适应复杂场景、并能满足人类的各种应用需求为目标的文本生成算法模型成为学术界与产业界共同关注的焦点.然而,ChatGPT等大规模语言模型(Large Language Model,LLM)高度忠实于用户意图的优势隐含了部分的... 近年来,以ChatGPT为代表的能够适应复杂场景、并能满足人类的各种应用需求为目标的文本生成算法模型成为学术界与产业界共同关注的焦点.然而,ChatGPT等大规模语言模型(Large Language Model,LLM)高度忠实于用户意图的优势隐含了部分的事实性错误,而且也需要依靠提示内容来控制细致的生成质量和领域适应性,因此,研究以内在质量约束为核心的文本生成方法仍具有重要意义.本文在近年来关键的内容生成模型和技术对比研究的基础上,定义了基于内在质量约束的文本生成的基本形式,以及基于“信、达、雅”的6种质量特征;针对这6种质量特征,分析并总结了生成器模型的设计和相关算法;同时,围绕不同的内在质量特征总结了多种自动评价和人工评价指标与方法.最后,本文对文本内在质量约束技术的未来研究方向进行了展望. 展开更多
关键词 自然语言处理 语言模型 文本生成 文本质量 文本评价
在线阅读 下载PDF
电网设备缺陷文本的质量评价与提升方法 被引量:34
13
作者 邵冠宇 王慧芳 何奔腾 《电网技术》 EI CSCD 北大核心 2019年第4期1472-1479,共8页
文本质量直接影响着文本挖掘效果的优劣。在总结电网企业缺陷文本存在的质量问题基础上,提出了缺陷文本质量评价和提升方法。首先,通过对大量实际缺陷文本的分析,总结出电网设备缺陷文本的格式及容易出现的不完整、不具体、冗余度过高... 文本质量直接影响着文本挖掘效果的优劣。在总结电网企业缺陷文本存在的质量问题基础上,提出了缺陷文本质量评价和提升方法。首先,通过对大量实际缺陷文本的分析,总结出电网设备缺陷文本的格式及容易出现的不完整、不具体、冗余度过高等问题。然后,基于相应问题,定义了缺陷文本质量的评价指标,并提出了基于"层次-自适应灰色关联分析法"的评价方法。接下来,针对历史缺陷文本中质量较差和缺陷等级与缺陷描述不匹配的文本,利用潜在狄利克雷分布方法,结合国家电网有限公司的缺陷分类标准,进行修正以提升质量;针对新录入文本,利用文本质量评价方法进行质量问题提示,利用词向量映射方法给出修正建议,保证新录入缺陷文本的质量。最后,结合实例对修正前后的缺陷文本进行质量对比,算例表明,修正后的历史缺陷文本在文本质量得分上有较大提升,新录入文本存在的问题也能较为准确地识别并给出对应修正建议。 展开更多
关键词 电网设备缺陷文本 文本质量评价 层次-自适应灰色关联分析法 文本质量提升 潜在狄利克雷分布
在线阅读 下载PDF
人机多元反馈对提高英语写作文本质量的效果研究 被引量:22
14
作者 张华 《外语电化教学》 CSSCI 北大核心 2019年第2期34-39,共6页
自动写作评分系统的研发和使用推进了英语写作教学的改革。为探讨人机多元反馈和在线自动反馈两种评阅方式对提高英语写作文本质量的效果,该研究首先对实验班和对照班学生作文的前测和后测成绩进行配对样本t检验;然后使用Coh-Metrix工... 自动写作评分系统的研发和使用推进了英语写作教学的改革。为探讨人机多元反馈和在线自动反馈两种评阅方式对提高英语写作文本质量的效果,该研究首先对实验班和对照班学生作文的前测和后测成绩进行配对样本t检验;然后使用Coh-Metrix工具对两组学生的前测和后测中的写作文本进行分析,并对分析结果进行配对样本t检验;最后,结合问卷调查和访谈的结果对两种反馈方式进行差异比较。研究发现,人机多元反馈比在线自动反馈评阅方式更能促进写作质量的提高。该研究对如何利用自动评价系统优化写作效果具有重要意义。 展开更多
关键词 自动反馈 多元反馈 英语写作 文本质量
原文传递
基于改进循环池化网络的核电装备质量文本分类模型
15
作者 陆潜慧 张羽 +2 位作者 王梦灵 吴庭伟 单玉忠 《计算机应用》 CSCD 北大核心 2024年第7期2034-2040,共7页
核电装备质量文本描述了核电装备在设计、采购、施工和调试阶段出现的质量缺陷等问题。由于不同阶段质量事件的发生频率不同,且同一装备对应不同阶段的质量文本中存在相同的关键词和相似的表述形式,针对类型数量不均衡和语义描述耦合的... 核电装备质量文本描述了核电装备在设计、采购、施工和调试阶段出现的质量缺陷等问题。由于不同阶段质量事件的发生频率不同,且同一装备对应不同阶段的质量文本中存在相同的关键词和相似的表述形式,针对类型数量不均衡和语义描述耦合的质量文本分类问题,提出一种融合正则反馈焦点损失函数的改进循环池化网络分类模型。首先,采用BERT(Bidirectional Encoder Representation from Transformers)将核电装备质量文本转化为词向量;然后,提出一个改进的3层循环池化网络的分类模型结构,通过增加中间层并选择合适权重,扩大参数训练的提取空间,提升表征质量缺陷语义特征的能力;接着,提出正则反馈焦点损失函数来训练提出分类模型的参数,通过正则项使损失函数的梯度变化更稳定,根据反馈项对损失函数进行基于真实值和预测值之间误差的迭代调整,解决了不均衡样本在训练过程中梯度偏向不均衡的问题;最后,通过归一化指数函数计算出核电装备质量事件对应的阶段。在某核电公司真实数据集和公共数据集上,与Fast_Text网络相比,所提模型的F1值分别提高了2个百分点和1个百分点,实验结果表明该模型在文本分类任务中具有较高的准确性。 展开更多
关键词 改进循环池化网络 焦点损失 核电装备质量文本 质量事件分类 自然语言处理
在线阅读 下载PDF
非对称同伴评价对英语写作文本质量的影响研究——基于Peerceptiv互评系统 被引量:8
16
作者 李书影 王宏俐 《外语电化教学》 CSSCI 北大核心 2021年第4期80-85,12,共7页
基于Peerceptiv互评系统,该研究采用量化数据与质性分析相结合的方法,探究78名非英语专业大学生通过非对称同伴评价所构建的"学习共同体"对其写作文本质量的影响。研究发现,前后测文本成绩呈现显著性差异;文本质量在熵、词汇... 基于Peerceptiv互评系统,该研究采用量化数据与质性分析相结合的方法,探究78名非英语专业大学生通过非对称同伴评价所构建的"学习共同体"对其写作文本质量的影响。研究发现,前后测文本成绩呈现显著性差异;文本质量在熵、词汇密度、主题集中度等词汇维度,平均句长、被动句、可读性等句子维度,搭配不当、词性误用等错误分布维度方面均呈现不同幅度的变化。基于反思日志主题分析,学习者认同非对称同伴评价在逻辑结构、连贯衔接、语言规范性等文本质量维度的提升效果,通过"有意义"的互助支架成长为自主的知识建构者。 展开更多
关键词 Peerceptiv 同伴评价 学习共同体 支架 写作文本质量
原文传递
持续经营审计意见能提升文本信息披露质量吗?——基于管理层语调操纵的视角 被引量:6
17
作者 苗霞 《财会通讯》 北大核心 2020年第7期29-35,共7页
该研究旨在探讨持续经营审计意见对文本信息的治理效应。聚焦于前瞻性文本信息,运用文本分析法构建管理层语调操纵指标,以2012—2017年A股财务困境公司为样本进行回归分析,研究发现持续经营审计意见能够抑制前瞻性信息中管理层语调操纵... 该研究旨在探讨持续经营审计意见对文本信息的治理效应。聚焦于前瞻性文本信息,运用文本分析法构建管理层语调操纵指标,以2012—2017年A股财务困境公司为样本进行回归分析,研究发现持续经营审计意见能够抑制前瞻性信息中管理层语调操纵行为,且这种效应在非国有企业中更显著。进一步考虑内外部监督机制的影响,发现持续经营审计意见对管理层语调操纵的抑制作用在分析师跟踪关注度高、企业内部控制质量低时更显著。 展开更多
关键词 持续经营审计意见 管理层语调操纵 文本信息披露质量
在线阅读 下载PDF
在线评论文本信息质量等级的测量探析——基于模糊综合评价法 被引量:5
18
作者 陈涛 谢丽莎 《科技创业月刊》 2012年第7期50-52,共3页
在线评论的文本信息中包含了丰富的商品信息,文本的信息质量对于消费者的购买决策有着重要作用。运用层次分析法和模糊综合评价法建立了在线评论文本信息质量等级的评价指标体系,确定了各指标的权重,构造了隶属函数并确定隶属度,减少了... 在线评论的文本信息中包含了丰富的商品信息,文本的信息质量对于消费者的购买决策有着重要作用。运用层次分析法和模糊综合评价法建立了在线评论文本信息质量等级的评价指标体系,确定了各指标的权重,构造了隶属函数并确定隶属度,减少了评价的主观性,使评价结果更加客观真实。以凡客诚品在线购物网站中某商品的两条在线评论为例,在调研的基础上,针对其文本信息质量,运用模糊综合评价方法进行评价。 展开更多
关键词 在线评论 文本信息质量 模糊综合评价法
在线阅读 下载PDF
文本无关发音质量评估系统中声学模型的若干研究和改进
19
作者 蒋同海 齐耀辉 +1 位作者 葛凤培 颜永红 《网络新媒体技术》 2012年第2期47-53,共7页
在无关的发音质量评估系统中,需要先识别出待测语音的说话内容,才能进行准确评估。真实的评测数据往往有很多不利的因素影响识别正确率,包括噪声、方言口音、信道噪声、说话随意性等。针对这些不利因素,本文对声学模型进行了深入的研究... 在无关的发音质量评估系统中,需要先识别出待测语音的说话内容,才能进行准确评估。真实的评测数据往往有很多不利的因素影响识别正确率,包括噪声、方言口音、信道噪声、说话随意性等。针对这些不利因素,本文对声学模型进行了深入的研究,包括:在训练数据中加入背景噪声,增强了模型的抗噪声能力;采用基于说话人的倒谱均值方差规整(SCMVN),降低信道及说话人个体特性的影响;用和待测语音相同地域的朗读数据做最大后验概率(MAP)自适应,使模型带有当地方言口音的发音特点;用自然口语数据做MAP自适应,使模型较好地描述自然口语中比较随意的发音现象。实验结果表明,使用这些措施之后,使待测语音的识别正确率相对提高了44.1%,从而使机器评分和专家评分的相关系数相对提高了6.3%。 展开更多
关键词 文本无关发音质量评估 声学模型 MAP 基于说话人的倒谱均值方差规整
在线阅读 下载PDF
多尺度核电质量文本故障信息语义抽取方法 被引量:3
20
作者 吴庭伟 王梦灵 +1 位作者 易树平 郭景任 《中国机械工程》 EI CAS CSCD 北大核心 2023年第8期976-981,992,共7页
提出了多尺度核电质量文本故障信息语义抽取方法,从核电质量文本描述中获取了存在质量缺陷的故障设备与所属阶段的信息。针对故障设备与正常设备并存,以及所属设计、采购、施工和调试的全价值链阶段未描述的问题,提出了多尺度故障信息... 提出了多尺度核电质量文本故障信息语义抽取方法,从核电质量文本描述中获取了存在质量缺陷的故障设备与所属阶段的信息。针对故障设备与正常设备并存,以及所属设计、采购、施工和调试的全价值链阶段未描述的问题,提出了多尺度故障信息抽取策略。基于Transformer双向编码的预训练语言模型将核电质量文本转化为文本向量;采用注意力机制的双向门控循环神经网络挖掘出质量缺陷的关键语义特征;采用条件随机场对关键语义特征进行实体预测,输出故障设备;通过多层感知机对提取的关键语义特征进行微调及推理,解译出故障设备所属阶段。最后,在真实的核电质量文本数据集上进行验证,F1值达到94.3%,表明提出的方法具有较好可行性和有效性。 展开更多
关键词 多尺度 核电质量文本 语义抽取 预训练语言模型 条件随机场
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部