摘要
汉语问句分类是问答系统中重要的组成部分,问句分类结果的好坏直接影响问答系统的质量。利用知网(HowNet)义原树计算问句之间的语义相似度,并以此作为句子之间的距离度量,利用KNN算法构造分类器进行问句分类,并对最近邻分类算法、KNN分类算法及改进的KNN分类算法进行实验比较。结果表明加权的KNN分类器分类效果最好,达到了89.8%的精确率。
Sentences similarity is caculated based on HowNet sermemes tree. This paper presents semantic similarity between sentences as the distance of sentences, and adopts KNN classification learning algorithm for question classification. The experiments show that the modified KNN method is better than the other two, and the classification precision reaches 89.8%.
出处
《微电子学与计算机》
CSCD
北大核心
2008年第1期156-158,共3页
Microelectronics & Computer
基金
教育部博士点基金项目(20050007023)
关键词
问句分类
语义相似度
KNN分类器
question classification
semantic similarity
KNN classifier