期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于主题N元语法模型的科技报告主题分析 被引量:2
1
作者 安欣 徐硕 《农业图书情报》 2019年第6期21-30,共10页
作为科技情报的重要载体之一,科技报告可以反映科技发展的脉络,可以揭示科技前沿的动态,甚至可以洞察科技发展的趋势等。中国科技报告的开发利用研究目前主要集中在书本型科技报告或电子出版物的出版发行、数据库建设、服务方式和知识... 作为科技情报的重要载体之一,科技报告可以反映科技发展的脉络,可以揭示科技前沿的动态,甚至可以洞察科技发展的趋势等。中国科技报告的开发利用研究目前主要集中在书本型科技报告或电子出版物的出版发行、数据库建设、服务方式和知识产权等方面,在深度数据挖掘方面的研究工作相对较少。笔者尝试利用主题N元语法模型对科技报告进行领域深层主题分析,为了确定特定领域科技报告的主题数目,笔者借助动态规划的思想针对主题N元语法模型提出了困惑度的有效计算方法。最后,以肿瘤领域1344条科技报告为实验数据,揭示了以“分子机制/肿瘤细胞”和“系统生物学/关键方法”为代表的70个主题,验证了利用主题N元语法模型揭示科技报告领域深层主题的可行性和有效性。 展开更多
关键词 科技报告 主题n元语法模型 主题分析 困惑度 热力图
在线阅读 下载PDF
基于n元语法模型的领域语音指令识别 被引量:1
2
作者 吴应中 朱华勇 李杰 《微计算机信息》 2009年第14期234-236,共3页
本文采用一种音素匹配法结合改进了的n元语法模型的方法,对语音指令进行理解。指令按照结构划分类别,通过提取其中关键要素来获取指令语义。音素匹配法可以提取指令中部分或全部要素;对于指令中未识别的要素则根据已正确识别的部分,采... 本文采用一种音素匹配法结合改进了的n元语法模型的方法,对语音指令进行理解。指令按照结构划分类别,通过提取其中关键要素来获取指令语义。音素匹配法可以提取指令中部分或全部要素;对于指令中未识别的要素则根据已正确识别的部分,采用改进的n元语法模型进行推测。实验表明该方法取得了较好的效果,并在原有的基础上有一定的提高。 展开更多
关键词 自然语言理解 音素匹配 n元语法模型 指令理解
在线阅读 下载PDF
基于N-Gram模型的高速汉字编码识别系统 被引量:4
3
作者 李继锋 刘群 《计算机工程与应用》 CSCD 北大核心 2004年第3期39-41,177,共4页
该文提出了一个应用n元语法模型(N-Gram)自动识别文档中汉字编码的方法,并介绍了一个已投入使用的汉字编码自动识别系统的设计和具体实现。该系统采用的是以字为基本单位的一元语法模型Uni-Gram,建立在语料库的基础上,仅用输入前N个字... 该文提出了一个应用n元语法模型(N-Gram)自动识别文档中汉字编码的方法,并介绍了一个已投入使用的汉字编码自动识别系统的设计和具体实现。该系统采用的是以字为基本单位的一元语法模型Uni-Gram,建立在语料库的基础上,仅用输入前N个字的字频计算输入串的生成概率,可以高速、准确识别。 展开更多
关键词 编码识别 n元语法模型 语法模型 n—Gram模型 自动识别文档 汉字编码
在线阅读 下载PDF
一种不需分词的中文文本分类方法 被引量:5
4
作者 许云 樊孝忠 张锋 《北京理工大学学报》 EI CAS CSCD 北大核心 2005年第9期778-781,共4页
提出了一种不需分词的n元语法文本分类方法.与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了可能造成有用信息丢失的特征选择过程.由于字的数量远小于词的数量,所以该分类方法与其它在... 提出了一种不需分词的n元语法文本分类方法.与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了可能造成有用信息丢失的特征选择过程.由于字的数量远小于词的数量,所以该分类方法与其它在词级别上的分类方法相比,有效地降低了数据稀疏带来的影响.系统地研究了模型中的关键因素以及它们对分类结果的影响.使用中文TREC提供的数据进行实验,结果表明,综合评价指标Fβ=1达到86.8%. 展开更多
关键词 文本分类 分词 n元语法模型
在线阅读 下载PDF
Web问答系统中问句理解的研究 被引量:3
5
作者 苏斐 高德利 叶晨 《测试技术学报》 2012年第3期207-212,共6页
对问答系统中的问句理解技术进行了深入研究,提出了对问句信息进行深层挖掘形成问句表征.对问句进行分词、去停用词等预处理;结合FAQ库和网络对问句进行关键词扩展,以网络为语料库,利用N元语法模型对问句中的新词进行识别,利用规则的方... 对问答系统中的问句理解技术进行了深入研究,提出了对问句信息进行深层挖掘形成问句表征.对问句进行分词、去停用词等预处理;结合FAQ库和网络对问句进行关键词扩展,以网络为语料库,利用N元语法模型对问句中的新词进行识别,利用规则的方法对问句进行分类;利用原始关键词+扩展词+新词+类别的形式对问句的信息进行表征.基于上述理论实现一个问答系统并进行了验证,实验表明:文中的问句理解方法能有效改善系统的性能. 展开更多
关键词 问句理解 关键词提取 新词识别 预处理 关键词扩展 n元语法模型
在线阅读 下载PDF
独立于语种的文本分类方法
6
作者 陈林 杨丹 《计算机工程与科学》 CSCD 2008年第6期128-130,139,共4页
本文提出了一种独立于语种不需分词的文本分类方法。与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了特征选择和大量预处理过程。我们系统地研究了模型中的关键因素以及它们对分类结果... 本文提出了一种独立于语种不需分词的文本分类方法。与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了特征选择和大量预处理过程。我们系统地研究了模型中的关键因素以及它们对分类结果的影响,并详细介绍了评价方法。该文本分类方法已经在中文和英文两个语种上得到实现,并获得了较好的分类性能。 展开更多
关键词 文本分类 n元语法模型 语种
在线阅读 下载PDF
基于相干机制的评论情感分析及长文本的情感极性探讨
7
作者 黄人伟 《移动信息》 2020年第3期78-79,共2页
随着人工智能领域的快速发展,智能化的评论数据分析成为用户生成内容分析的一大研究热点。在实际评论过程中,由于评论者的素质差异及评论用语的随意性,使部分评论文本相干性不强且情感词模糊。本文以亚马逊商品评论数据集作为样本研究数... 随着人工智能领域的快速发展,智能化的评论数据分析成为用户生成内容分析的一大研究热点。在实际评论过程中,由于评论者的素质差异及评论用语的随意性,使部分评论文本相干性不强且情感词模糊。本文以亚马逊商品评论数据集作为样本研究数据,建立分析模型对钉钉评论数据进行评论相干性和情感极性的分析,提出基于相干机制的评论数据处理模型,对评论长度较长的评论,使用N元语法模型和信息量的办法,结合情感词的上下文语境,采用自适应的办法对情感词的情感范围进行情感极性的计算,提高了长评论文本的情感极性准确率。与现有的情感词典分词的方法相比,达到了更好的效果。 展开更多
关键词 情感分析 相干机制 n元语法模型 神经网络 自然语言处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部