期刊文献+

基于Trie树的京剧术语语义词典 被引量:3

Beijing Opera Professional Words Semantic Dictionary Based on Trie Tree
在线阅读 下载PDF
导出
摘要 现有的中文分词系统缺少专业分词组件,难以满足特定领域术语分词的需求,导致专业领域分词精确度较低。为此,提出基于Trie树的京剧术语词典。扩展主流词库,通过定义语义代码的方式建立京剧专业术语之间的语义联系,并利用双数组算法实现Trie。实验结果表明,加入专业术语词典可以提高系统的分词准确率。 现有的中文分词系统缺少专业分词组件,难以满足特定领域术语分词的需求,导致专业领域分词精确度较低。为此,提出基于Trie树的京剧术语词典。扩展主流词库,通过定义语义代码的方式建立京剧专业术语之间的语义联系,并利用双数组算法实现Trie。实验结果表明,加入专业术语词典可以提高系统的分词准确率。
作者 乐娟
出处 《计算机工程》 CAS CSCD 北大核心 2011年第S1期30-32,共3页 Computer Engineering
关键词 中文分词 分词词典 京剧术语 语义词典 双数组Trie Chinese words segmentation segmentation dictionary Beijing Opera professional words semantic dictionary double array Trie
  • 相关文献

参考文献5

  • 1刘遥峰,王志良,王传经.中文分词和词性标注模型[J].计算机工程,2010,36(4):17-19. 被引量:11
  • 2王思力,张华平,王斌.双数组Trie树算法优化及其应用研究[J].中文信息学报,2006,20(5):24-30. 被引量:29
  • 3Gioran C.Double Array Trie[].https://githubcom/digitalstain/DoubleArrayTrie.2011
  • 4Aoe,J.An Efficient Digital Search Algorithm by Using a Double-Array Structure[].IEEE Transactions on Software Engineering.1989
  • 5Yata S,Oono M.A compact static double- array keeping character codes[].Information Processing Letters.2007

二级参考文献14

共引文献37

同被引文献20

引证文献3

二级引证文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部