期刊文献+

统计与规则相结合的术语抽取 被引量:7

Term extraction based on the combination of statistics and rules
在线阅读 下载PDF
导出
摘要 在面向特定领域的分词中,术语抽取效果的好坏会对分词精度产生很大影响。因此,高精度的术语抽取成为领域分词的基础工作。针对特定领域提出了一种统计和规则相结合的术语抽取方法。在条件随机场给出的5-best结果的基础上,通过规则及给分机制进行术语抽取,并对抽取结果利用规则进行后处理。实验表明,相比于传统的基于条件随机场1-best进行的术语抽取,该方法能够明显提高未登录术语的召回率。 The extraction of terms has a significant impact on the precision of domain-specific word segmen- tation. Based on the combination of statistics and rules, this paper proposes a method of term extraction for a certain specific. The 5-best results are achieved with Conditional Random Fields first, then the term extrac- tion is performed with rules and scoring mechanism, finally the extracted data are post-processed with rules. Compared to the term extraction of 1-best output based on Conditional Random Fields, this method can ef- fectively improve the recall rate of the out-of-vocabulary terms.
出处 《沈阳航空航天大学学报》 2011年第5期71-74,共4页 Journal of Shenyang Aerospace University
关键词 术语抽取 条件随机场 未登录术语 5-best term extraction Conditional Random Fields out-of-vocabulary term 5-best
  • 相关文献

参考文献7

二级参考文献36

共引文献87

同被引文献82

引证文献7

二级引证文献36

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部