-
题名面向机器阅读理解的边界感知方法
- 1
-
-
作者
刘青
陈艳平
邹安琪
黄瑞章
秦永彬
-
机构
贵州大学文本计算与认知智能教育部工程研究中心
公共大数据国家重点实验室(贵州大学)
贵州大学计算机科学与技术学院
-
出处
《计算机应用》
CSCD
北大核心
2024年第7期2004-2010,共7页
-
基金
国家自然科学基金资助项目(62166007)
贵州省科技支撑计划项目([2022]277)。
-
文摘
针对现有的基于预训练语言模型的答案获取方法存在预测边界不够准确的问题,提出一种面向片段抽取式机器阅读理解(MRC)的边界感知方法。首先,在问题输入阶段引入特殊字符标记问题边界,通过增强问题语义信息的方式实现对问题边界的感知;其次,在答案预测阶段,构建答案边界回归器,实现感知的问题边界语义信息与输出的预测答案边界语义信息的语义交互;最后,通过交互后的语义信息进一步调整存在偏差的预测答案边界,实现对预测答案的校准。实验结果表明,与SpanBERT(Span-based Bidirectional Encoder Representation from Transformers)相比,该方法在公共数据集SQuAD(Stanford Question Answering Dataset)1.1上的F1值提升了0.2个百分点、精确匹配(EM)值提升了0.9个百分点;在HotpotQA(Hotpot Question Answering)数据集上的F1值和EM值都提升了0.7个百分点;在NewsQA(News Question Answering)数据集上的F1值提升了2.8个百分点、EM值提升了3.3个百分点。可见,该方法能有效增强对问题边界信息的感知并且实现对预测答案边界的校准,有利于更好地理解和分析文本数据,在智能问答、智能客服等领域的应用中提高系统的准确性。
-
关键词
机器阅读理解
问题边界感知
答案边界回归
片段抽取
-
Keywords
Machine Reading Comprehension(MRC)
question boundary-awareness
answer boundary regression
span extraction
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-