基于特征组合的中文语义角色标注被引量：14

Chinese Semantic Role Labeling Based on Feature Combination

下载PDF

导出

摘要提出一种基于特征组合和支持向量机(support vector machine,简称SVM)的语义角色标注(semantic role labeling,简称SRL)方法.该方法以句法成分作为基本标注单元,首先从当前基于句法分析的语义角色标注系统中选出高效特征,构成基本特征集合.然后提出一种基于统计的特征组合方法.该方法能够根据正反例中组合特征的分布状况,以类间距离和类内距离之比作为统计量来衡量组合特征对分类所产生的效果,保留分类效果较好的组合特征.最后,在Chinese PropBank(CPB)语料上利用支持向量机进行分类实验,结果表明,引入该特征组合方法后,语义角色标注整体F值达91.81%,提高了近2%. This paper proposes a semantic role labeling （SRL） approach for the Chinese, based on feature combination and support vector machine （SVM）. The approach takes the constituent as the labeling unit. First, this paper defines the basic feature set by selecting the high-performance features of existing parsing-based SRL systems. Then, a statistics-based method is proposed to construct a combined feature set derived from the basic feature set. According to the distribution of combining features in both positive and negative instances, the ratio of between-class to within-class distance is utilized as the measurement of classifying the performance the feature, and then choosing the combining features with high ratios into the combining feature set. Finally, the experimental results show that the feature combination method-based SRL achieved 91.81% F-score on Chinese PropBank （CPB） corpus, nearly 2% higher than the traditional method.

作者李世奇赵铁军李晗静刘鹏远刘水

机构地区哈尔滨工业大学计算机科学与技术学院北京大学计算语言学研究所

出处《软件学报》 EI CSCD 北大核心 2011年第2期222-232,共11页 Journal of Software

基金国家自然科学基金(60736014 60803094 60773069 60903063)

关键词语义角色标注自然语言处理支持向量机特征组合 semantic role labeling natural language processing support vector machine feature combination

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3):565-573. 被引量：73
2刘怀军,车万翔,刘挺.中文语义角色标注的特征工程[J].中文信息学报,2007,21(1):79-84. 被引量：39
3丁金涛,王红玲,周国栋,朱巧明,钱培德.语义角色标注中特征优化组合研究[J].计算机应用与软件,2009,26(5):17-21. 被引量：7

二级参考文献50

1刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3):565-573. 被引量：73
2Gildea D ,Jurafsky D. Automatic labeling of semantic roles[ J]. Computational Linguistics, 2002, 28 (3) :245 - 288.
3Carreras X, Marquez L. Introduction to the CoNLL-2005 Shared Task: Semantic Role Labeling[C]. In: Knight K, Ng HT, Oflazer K, eds. Proc. of the CoNLL 2005. Ann Arbor: ACL, 2005, 152 - 164.
4Palmer M,Gildea D,Kirtssbury P.The Proposition Bank: An annotated corpus of semantic roles[ J ]. Computational Linguistics,2005,31 (1) :71 - 106.
5Gildea D, Palmer M. The necessity of syntactic parsing for predicate argument recognition [ C ]. In Proceedings of ACL-2002, Philadelphia, PA ,2002:239-246.
6Surdeanu M, Harabagiu S, Williams J, et al. Using predicate-argument structures for information extraction[ C ]. In Proceedings of ACL-2003, Sapporo, Japan, 2003.
7Xue N ,Palmer M. Calibrating features for semantic role labeling[ C]. In Proceedings of EMNLP-2004, Barcelona, Spain ,2004.
8Pradhan S,Hacioglu K,Ward W,et al. Semantic role parsing: Adding semantic structure to unstructured text[ C ]. In ICDM-03, Melbourne, Florida, 2003.
9Pradhan S, Ward W, Hacioglu K, et al. Shallow Semantic Parsing Using Support Vector Machines [ C ]. In Proceedings of NAACL-HLT 2004, Boston, Mass ,2004.
10Pradhan S, Hacioglu K, Krugler V, et al. Support vector learning for semantic argument classification [ J ]. Machine Learning Journal, 2005, 60(3) :11 -39.

共引文献93

1刘亚慧,杨浩苹,李正华,张民.一种轻量级的汉语语义角色标注规范[J].中文信息学报,2020(4):10-20. 被引量：4
2丁金涛,周国栋,王红玲,朱巧明.语义角色标注中有效的识别论元算法研究[J].计算机工程与应用,2008,44(18):153-156. 被引量：2
3方巍,黄黎,崔志明.基于最大熵分类器的Deep Web查询接口自动判定[J].计算机工程与应用,2008,44(21):133-137. 被引量：1
4丁伟伟,常宝宝.基于最大熵原则的汉语语义角色分类[J].中文信息学报,2008,22(6):20-26. 被引量：11
5丁金涛,王红玲,周国栋,朱巧明,钱培德.语义角色标注中特征优化组合研究[J].计算机应用与软件,2009,26(5):17-21. 被引量：7
6陈丽江,陈小荷.统计和规则结合识别动词的跨分句论元[J].计算机工程与应用,2009,45(16):40-42.
7谢毓湘,栾悉道,吴玲达,谭洁,陈丹雯.基于概念的多媒体数据语义检索模型[J].计算机应用研究,2009,26(8):2945-2947.
8汪红林,王红玲,周国栋.基于依存关系的语义角色标注[J].计算机工程,2009,35(15):82-84. 被引量：4
9贾君枝,赵文娟,王东元.汉语框架网络知识库的语义角色特征识别[J].图书情报工作,2009,53(17):110-113. 被引量：4
10丁伟伟,常宝宝.基于语义组块分析的汉语语义角色标注[J].中文信息学报,2009,23(5):53-61. 被引量：24

同被引文献154

1胡斌,汤伟,刘晓明.基于自然语言理解的文本标图系统设计与实现[J].解放军理工大学学报（自然科学版）,2005,6(2):132-136. 被引量：9
2崔雷.当年高被引论文的主题词链聚类分析及其在情报预测中的应用[J].情报学报,1995,14(5):368-373. 被引量：11
3由丽萍,张惠春.基于规则的中文框架元素自动标注方法研究[J].情报学报,2011,30(2):166-171. 被引量：2
4袁毓林.用动词的论元结构跟事件模板相匹配——一种由动词驱动的信息抽取方法[J].中文信息学报,2005,19(5):37-43. 被引量：22
5卢志茂,刘挺,李生.统计词义消歧的研究进展[J].电子学报,2006,34(2):333-343. 被引量：28
6吴平.论元控制谓词与非论元控制谓词的逻辑语义分析与计算[J].外语与外语教学,2006(3):5-10. 被引量：4
7吕德新,张桂平,蔡东风,朱江涛.基于SVM的疑问句问点语义角色标注[J].沈阳航空工业学院学报,2006,23(1):44-46. 被引量：4
8洪铭材,张阔,唐杰,李涓子.基于条件随机场(CRFs)的中文词性标注方法[J].计算机科学,2006,33(10):148-151. 被引量：56
9杨健,高文逸,王衍波.一种作战文书军事标图自动化方法[J].解放军理工大学学报（自然科学版）,2006,7(6):543-547. 被引量：11
10刘怀军,车万翔,刘挺.中文语义角色标注的特征工程[J].中文信息学报,2007,21(1):79-84. 被引量：39

引证文献14

1陈菜芳.中文语义角色标注研究概述[J].文教资料,2012(27):139-141. 被引量：1
2季陶美,刘茂福,张璐,杨晓.基于聚类分析的事件语义模式获取[J].微型机与应用,2013,32(2):63-66. 被引量：1
3路青,崔新春,胡艳波.基于文献计量的国内语义角色标注研究现状分析[J].情报杂志,2012,31(4):43-47.
4吕雷.基于CRFsuite分类器的汉语框架语义角色标注[J].电脑开发与应用,2014,27(4):8-11.
5宋毅君,王瑞波,李济洪,李国臣.基于条件随机场的汉语框架语义角色自动标注[J].中文信息学报,2014,28(3):36-47. 被引量：8
6谢宝陵,刘侃,汤超君.作战文书关键信息抽取方法[J].计算机与数字工程,2014,42(11):2142-2145. 被引量：3
7马建红,张明月,赵亚男.面向创新设计的专利知识抽取方法[J].计算机应用,2016,36(2):465-471. 被引量：9
8赵冬晓,王效岳,白如江,刘自强.面向情报研究的文本语义挖掘方法述评[J].现代图书情报技术,2016(10):13-24. 被引量：7
9孟令恩,何彦青,李颖.中文语义角色标注在情报分析领域的应用研究[J].情报工程,2016,2(1):43-52.
10杨凤玲,周俏丽,蔡东风,季铎.结合短语结构句法的语义角色标注[J].中文信息学报,2018,32(6):1-11. 被引量：4

二级引证文献43

1王奎芳,吕璐成,孙文君,王翼虎,赵亚娟.基于大模型知识蒸馏的专利技术功效词自动抽取方法研究:以车联网V2X领域为例[J].数据分析与知识发现,2024,8(8):144-156. 被引量：2
2陈亮,尚玮姣,余池,牟琳,夏春姊,葛川.利用技术分类号辅助的无监督专利实体抽取方法研究[J].知识管理论坛,2024(4):422-436.
3唐坚,刘海燕.作战文书中部队番号的自动识别方法[J].兵器装备工程学报,2020,0(2):143-147. 被引量：1
4柏晓鹏.义类标注:必要性和可行性[J].语言学论丛,2020(1):116-134.
5郑丽娟,邵艳秋,杨尔弘.中文非投射语义依存现象分析研究[J].中文信息学报,2014,28(6):41-47. 被引量：7
6魏伟青,陈磊,骆汉宾.基于聚类分析的越江地铁隧道地质安全评价[J].土木工程与管理学报,2015,32(1):72-76. 被引量：4
7赵冬晓,王效岳,白如江,刘自强.面向情报研究的文本语义挖掘方法述评[J].现代图书情报技术,2016(10):13-24. 被引量：7
8宋江胜.情报研究探索[J].内江科技,2017,38(2):65-65.
9王瑞波,李济洪,李国臣,杨耀文.基于Dropout正则化的汉语框架语义角色识别[J].中文信息学报,2017,31(1):147-154. 被引量：16
10吴正,李少波,杨观赐.基于向量空间的专利类比挖掘算法[J].科学技术与工程,2017,17(11):74-78. 被引量：3

1于江德,樊孝忠,庞文博,余正涛.Semantic role labeling based on conditional random fields[J].Journal of Southeast University(English Edition),2007,23(3):361-364. 被引量：9
2王文学,李芳.基于联合方法的中文语义角色标注[J].小型微型计算机系统,2011,32(11):2315-2319.
3汪红林,王红玲,周国栋.基于依存关系的语义角色标注[J].计算机工程,2009,35(15):82-84. 被引量：4
4丁金涛,周国栋,王红玲,朱巧明.语义角色标注中有效的识别论元算法研究[J].计算机工程与应用,2008,44(18):153-156. 被引量：2
5熊皓,刘群,吕雅娟.基于图模型的语义角色标注重排序[J].中文信息学报,2013,27(5):51-59.
6孟令恩,何彦青,李颖.中文语义角色标注在情报分析领域的应用研究[J].情报工程,2016,2(1):43-52.
7夏宇.基于GA-ELMAN神经网络的句法成分分析研究[J].科技情报开发与经济,2010,20(33):100-104.
8张晓孪.基于语义角色标注的问答系统的研究与实现[J].计算机与数字工程,2012,40(7):38-40.
9刘怀军,车万翔,刘挺.中文语义角色标注的特征工程[J].中文信息学报,2007,21(1):79-84. 被引量：39
10宋毅君,王瑞波,李济洪,李国臣.基于条件随机场的汉语框架语义角色自动标注[J].中文信息学报,2014,28(3):36-47. 被引量：8

软件学报

2011年第2期

浏览历史

内容加载中请稍等...

基于特征组合的中文语义角色标注被引量：14

参考文献3

二级参考文献50

共引文献93

同被引文献154

引证文献14

二级引证文献43

相关作者

相关机构

相关主题

浏览历史

基于特征组合的中文语义角色标注 被引量：14

参考文献3

二级参考文献50

共引文献93

同被引文献154

引证文献14

二级引证文献43

相关作者

相关机构

相关主题

浏览历史

基于特征组合的中文语义角色标注被引量：14