期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于短语及依存的标注规则和短语识别算法研究

Research on Annotation Rules and Phrase Recognition Algorithm Based on Phrase and Dependency

下载PDF

导出

摘要目前,自然语言处理大多是借助于分词结果进行句法依存分析,主要采用基于监督学习的端对端模型。该方法主要存在两个问题,一是标注体系繁多,相对比较复杂;二是无法识别语言嵌套结构。为了解决以上问题,该文提出了基于短语窗口的依存句法标注规则,并标注了中文短语窗口数据集(CPWD),同时引入短语窗口模型。该标注规则以短语为最小单位,把句子划分为7类可嵌套的短语类型,同时标示出短语间的句法依存关系;短语窗口模型借鉴了计算机视觉领域目标检测的思想,检测短语的起始位置和结束位置,实现了对嵌套短语及句法依存关系的同步识别。实验结果表明,在CPWD数据集上,短语窗口模型比传统端对端模型F1值提升超过1个百分点。相应的方法应用到了CCL2018的中文隐喻情感分析比赛中,在原有基础上F1值提升了1个百分点以上,取得第一名成绩。 At present,most syntactic dependency analysis is conducted via supervised learning with the help of word segmentation results.This practice is challenged by complex label schemes and the nesting structure which is difficult to parse.This paper proposes a phrase window model together with a dependency syntax labeling rule based on the phrase window.The labeling rule divides sentences into 7 types of nestable phrases,with annotation for the syntactic dependence between phrases.Inspired by the idea of target detection in the computer vision field,the phrase window model detects the beginning and end positions of phrases and realizes the synchronous recognition of nested phrases and syntactic dependencies.Experimental results show that on the selfbuilt Chinese Phrase Window Dataset(CPWD),the phrase window model is more than 1 point better than the traditional endtoend model.The corresponding method won the champion in the CCL2018 Chinese Metaphor Sentiment Analysis Competition,which improved more than 1 point than the baseline.

作者刘广涂刚李政刘译键 LIU Guang;TU Gang;LI Zheng;LIU Yijian(School of Computer Science and Technology,Huazhong University of Science and Technology,Wuhan,Hubei 430074,China)

机构地区华中科技大学计算机科学与技术学院

出处《中文信息学报》 CSCD 北大核心 2024年第2期15-24,共10页 Journal of Chinese Information Processing

关键词自然语言处理标注体系短语识别依存分析 natural language processing tagging system phrase extraction dependency parsing

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1周强.汉语基本块规则的自动学习和扩展进化[J].清华大学学报（自然科学版）,2008,48(1):88-91. 被引量：6
2侯潇琪,王瑞波,李济洪.基于词的分布式实值表示的汉语基本块识别[J].中北大学学报（自然科学版）,2013,34(5):582-585. 被引量：4
3李国臣,党帅兵,王瑞波,李济洪.基于字的分布表征的汉语基本块识别[J].中文信息学报,2014,28(6):18-25. 被引量：6
4程钟慧,陈珂,陈刚,徐世泽,傅丁莉.卓越IT工程师系列教材源自实践服务教学[J].软件工程,2020,23(1):7-11. 被引量：4
5徐烈炯,沈阳.题元理论与汉语配价问题[J].当代语言学,1998(3):1-21. 被引量：74
6刘宇红.生成语法中词汇语义与句法的界面研究[J].外语学刊,2011(5):56-60. 被引量：13
7孙道功.基于大规模语义知识库的“词汇—句法语义”接口研究[J].语言文字应用,2016(2):125-134. 被引量：5
8亢世勇,许小星,马永腾.施事、受事句法实现的义类制约[J].语文研究,2011(4):36-40. 被引量：6
9丁伟伟,常宝宝.基于语义组块分析的汉语语义角色标注[J].中文信息学报,2009,23(5):53-61. 被引量：24
10王倩,罗森林,韩磊,潘丽敏.基于谓词及句义类型块的汉语句义类型识别[J].中文信息学报,2014,28(2):8-16. 被引量：3

二级参考文献106

1周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
2戴耀晶.现代汉语动作类二价动词探索[J].中国语文,1998(1):3-12. 被引量：27
3陈平.试论汉语中三种句子成分与语义成分的配位原则[J].中国语文,1994(3):161-168. 被引量：221
4张云秋.动词对受事宾语典型性强弱的制约[J].汉语学习,2005(3):11-16. 被引量：5
5罗振声,郑碧霞.汉语句型自动分析和分布统计算法与策略的研究[J].中文信息学报,1994,8(2):1-19. 被引量：21
6薛恩奎.配价、词义、句式—兼俄汉词汇语义-句法对比研究[J].中国俄语教学,2005,24(4):1-5. 被引量：2
7陆俭明.句法语义接口问题[J].外国语,2006,29(3):30-35. 被引量：58
8刘怀军,车万翔,刘挺.中文语义角色标注的特征工程[J].中文信息学报,2007,21(1):79-84. 被引量：39
9刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3):565-573. 被引量：73
10周强.汉语基本块描述体系[J].中文信息学报,2007,21(3):21-27. 被引量：25

共引文献123

1柳俊.语言类型学的定量转向——附议南方SVO型民族语的旁语类型特征[J].玉溪师范学院学报,2023,39(1):30-41.
2刘亚慧,杨浩苹,李正华,张民.一种轻量级的汉语语义角色标注规范[J].中文信息学报,2020(4):10-20. 被引量：4
3侯瑞芬.动形词类转变的语义分析[J].语言学论丛,2020(2):178-194. 被引量：4
4郭燕妮.致使义“把”字句的句式语义[J].盐城师范学院学报（人文社会科学版）,2008,28(3):29-31. 被引量：3
5岳中奇.也说“胜”和“败”[J].语言科学,2003,2(6):33-45. 被引量：5
6施琳.浅谈英汉配价语法及其局限性[J].南昌教育学院学报,2012,27(3).
7方欣欣.动词的语义特征决定“自己”的语义指向[J].首都师范大学学报（社会科学版）,2000(S3):1-10. 被引量：4
8陆俭明.关于句处理中所要考虑的语义问题[J].语言研究,2001,21(1):1-12. 被引量：25
9曾亦沙.论有标记抽象行为名词的语义特征[J].外语教学,2000,21(2):15-18. 被引量：3
10尹富林.试析“非宾格动词”语义结构的习得[J].外语教学,2000,21(3):74-77. 被引量：3

1刘广,涂刚,李政,刘译键,占志强.支持背景知识的多维端到端短语识别算法研究[J].计算机工程与应用,2022,58(8):147-155.
2朱佩来.融合注意力的方面情感三元组抽取研究[J].电脑知识与技术,2024,20(5):35-37.
3孙晨瑜,王振琦,张宝宇,张卫山,侯召祥,陈涛.基于RoBERTa-ND的中文实词辨析[J].计算机系统应用,2023,32(5):157-163.
4闫智超,李茹,苏雪峰,李欣杰,柴清华,韩孝奇,赵云肖.融合目标词上下文序列与结构信息的框架识别方法[J].中文信息学报,2024,38(1):86-96. 被引量：1
5吕健,张婧涵.《说文解字》“人”字元系列汉字释义研究[J].牡丹江师范学院学报（社会科学版）,2023(4):66-75.
6赵又霖,林怡妮,石燕青.融合情感语义与句法结构的中文开放域事理图谱构建研究[J].数字图书馆论坛,2024,20(3):12-24. 被引量：2
7郭云飞.词源学视角下的大学英语词汇记忆模式探究[J].锦州医科大学学报（社会科学版）,2024,22(2):103-106. 被引量：2
8吴芙芸,王芳.语境句中汉语话题结构的加工--基于主句和关系从句内宾语话题化对比[J].当代语言学,2024,26(1):40-53.

中文信息学报

2024年第2期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部