摘要
语义对文本复杂度的影响至关重要。本文聚焦中文文本语义复杂度特征,提出“语义依存构式”这一概念,将其作为文本分析的基本单位,构建出基于语义依存构式的中文文本复杂度特征体系;随后使用语义依存分析等自然语言处理技术对语义依存构式及其复杂度特征进行自动抽取和计算;最后,在文本复杂度分级任务中引入句法依存构式复杂度特征,对句法依存构式复杂度特征和语义依存构式复杂度特征分别构建机器学习模型,进行文本复杂度自动分级实验。实验结果显示,相较于句法依存构式复杂度特征,语义依存构式复杂度特征在中文文本复杂度分级任务中有更好的表现。
Semantics is of great importance to text complexity.This paper focuses on the semantic complexity of Chinese texts.Firstly,a“semantic dependency construction”(SDC)is proposed,based on which a systematic,comprehensive and fine-grained complexity feature system of Chinese texts is developed.Then,semantic dependency parsing and other NLP techniques are used to extract and calculate the semantic dependency constructions and their complexity features automatically.Finally,machine learning models for the complexity features of syntactic dependency constructions and of semantic dependency constructions are developed for the grading task of text complexity.The results show that compared with syntactic dependency construction,complexity features of semantic dependency construction have better performance in the complexity grading task for Chinese texts.
作者
殷晓君
邵艳秋
YIN Xiaojun;SHAO Yanqiu
出处
《语言文字应用》
CSSCI
北大核心
2023年第3期132-142,共11页
Applied Linguistics
基金
教育部人文社会科学研究青年基金项目“面向国际中文教育的文本智能分级系统研究与实现”(22YJCZH222)
国家自然科学基金项目“基于词汇语义网络的中文深层语义分析”(61872402)
2022年度国际中文教育研究课题重点项目“国际中文读写智能导学系统设计与应用”(22YH50B)
北京语言大学院级创新团队培育项目(YJT44)的研究成果。
关键词
语义复杂度
语义依存构式
特征
机器学习
semantic complexity
semantic dependency construction(SDC)
features
machine learning