期刊导航
期刊开放获取
VIP36
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于主题N元语法模型的科技报告主题分析
被引量:
2
1
作者
安欣
徐硕
《农业图书情报》
2019年第6期21-30,共10页
作为科技情报的重要载体之一,科技报告可以反映科技发展的脉络,可以揭示科技前沿的动态,甚至可以洞察科技发展的趋势等。中国科技报告的开发利用研究目前主要集中在书本型科技报告或电子出版物的出版发行、数据库建设、服务方式和知识...
作为科技情报的重要载体之一,科技报告可以反映科技发展的脉络,可以揭示科技前沿的动态,甚至可以洞察科技发展的趋势等。中国科技报告的开发利用研究目前主要集中在书本型科技报告或电子出版物的出版发行、数据库建设、服务方式和知识产权等方面,在深度数据挖掘方面的研究工作相对较少。笔者尝试利用主题N元语法模型对科技报告进行领域深层主题分析,为了确定特定领域科技报告的主题数目,笔者借助动态规划的思想针对主题N元语法模型提出了困惑度的有效计算方法。最后,以肿瘤领域1344条科技报告为实验数据,揭示了以“分子机制/肿瘤细胞”和“系统生物学/关键方法”为代表的70个主题,验证了利用主题N元语法模型揭示科技报告领域深层主题的可行性和有效性。
展开更多
关键词
科技报告
主题
n元语法模型
主题分析
困惑度
热力图
在线阅读
下载PDF
职称材料
基于n元语法模型的领域语音指令识别
被引量:
1
2
作者
吴应中
朱华勇
李杰
《微计算机信息》
2009年第14期234-236,共3页
本文采用一种音素匹配法结合改进了的n元语法模型的方法,对语音指令进行理解。指令按照结构划分类别,通过提取其中关键要素来获取指令语义。音素匹配法可以提取指令中部分或全部要素;对于指令中未识别的要素则根据已正确识别的部分,采...
本文采用一种音素匹配法结合改进了的n元语法模型的方法,对语音指令进行理解。指令按照结构划分类别,通过提取其中关键要素来获取指令语义。音素匹配法可以提取指令中部分或全部要素;对于指令中未识别的要素则根据已正确识别的部分,采用改进的n元语法模型进行推测。实验表明该方法取得了较好的效果,并在原有的基础上有一定的提高。
展开更多
关键词
自然语言理解
音素匹配
n元语法模型
指令理解
在线阅读
下载PDF
职称材料
基于N-Gram模型的高速汉字编码识别系统
被引量:
4
3
作者
李继锋
刘群
《计算机工程与应用》
CSCD
北大核心
2004年第3期39-41,177,共4页
该文提出了一个应用n元语法模型(N-Gram)自动识别文档中汉字编码的方法,并介绍了一个已投入使用的汉字编码自动识别系统的设计和具体实现。该系统采用的是以字为基本单位的一元语法模型Uni-Gram,建立在语料库的基础上,仅用输入前N个字...
该文提出了一个应用n元语法模型(N-Gram)自动识别文档中汉字编码的方法,并介绍了一个已投入使用的汉字编码自动识别系统的设计和具体实现。该系统采用的是以字为基本单位的一元语法模型Uni-Gram,建立在语料库的基础上,仅用输入前N个字的字频计算输入串的生成概率,可以高速、准确识别。
展开更多
关键词
编码识别
n元语法模型
一
元
语法
模型
n
—Gram
模型
自动识别文档
汉字编码
在线阅读
下载PDF
职称材料
一种不需分词的中文文本分类方法
被引量:
5
4
作者
许云
樊孝忠
张锋
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2005年第9期778-781,共4页
提出了一种不需分词的n元语法文本分类方法.与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了可能造成有用信息丢失的特征选择过程.由于字的数量远小于词的数量,所以该分类方法与其它在...
提出了一种不需分词的n元语法文本分类方法.与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了可能造成有用信息丢失的特征选择过程.由于字的数量远小于词的数量,所以该分类方法与其它在词级别上的分类方法相比,有效地降低了数据稀疏带来的影响.系统地研究了模型中的关键因素以及它们对分类结果的影响.使用中文TREC提供的数据进行实验,结果表明,综合评价指标Fβ=1达到86.8%.
展开更多
关键词
文本分类
分词
n元语法模型
在线阅读
下载PDF
职称材料
Web问答系统中问句理解的研究
被引量:
3
5
作者
苏斐
高德利
叶晨
《测试技术学报》
2012年第3期207-212,共6页
对问答系统中的问句理解技术进行了深入研究,提出了对问句信息进行深层挖掘形成问句表征.对问句进行分词、去停用词等预处理;结合FAQ库和网络对问句进行关键词扩展,以网络为语料库,利用N元语法模型对问句中的新词进行识别,利用规则的方...
对问答系统中的问句理解技术进行了深入研究,提出了对问句信息进行深层挖掘形成问句表征.对问句进行分词、去停用词等预处理;结合FAQ库和网络对问句进行关键词扩展,以网络为语料库,利用N元语法模型对问句中的新词进行识别,利用规则的方法对问句进行分类;利用原始关键词+扩展词+新词+类别的形式对问句的信息进行表征.基于上述理论实现一个问答系统并进行了验证,实验表明:文中的问句理解方法能有效改善系统的性能.
展开更多
关键词
问句理解
关键词提取
新词识别
预处理
关键词扩展
n元语法模型
在线阅读
下载PDF
职称材料
独立于语种的文本分类方法
6
作者
陈林
杨丹
《计算机工程与科学》
CSCD
2008年第6期128-130,139,共4页
本文提出了一种独立于语种不需分词的文本分类方法。与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了特征选择和大量预处理过程。我们系统地研究了模型中的关键因素以及它们对分类结果...
本文提出了一种独立于语种不需分词的文本分类方法。与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了特征选择和大量预处理过程。我们系统地研究了模型中的关键因素以及它们对分类结果的影响,并详细介绍了评价方法。该文本分类方法已经在中文和英文两个语种上得到实现,并获得了较好的分类性能。
展开更多
关键词
文本分类
n元语法模型
语种
在线阅读
下载PDF
职称材料
基于相干机制的评论情感分析及长文本的情感极性探讨
7
作者
黄人伟
《移动信息》
2020年第3期78-79,共2页
随着人工智能领域的快速发展,智能化的评论数据分析成为用户生成内容分析的一大研究热点。在实际评论过程中,由于评论者的素质差异及评论用语的随意性,使部分评论文本相干性不强且情感词模糊。本文以亚马逊商品评论数据集作为样本研究数...
随着人工智能领域的快速发展,智能化的评论数据分析成为用户生成内容分析的一大研究热点。在实际评论过程中,由于评论者的素质差异及评论用语的随意性,使部分评论文本相干性不强且情感词模糊。本文以亚马逊商品评论数据集作为样本研究数据,建立分析模型对钉钉评论数据进行评论相干性和情感极性的分析,提出基于相干机制的评论数据处理模型,对评论长度较长的评论,使用N元语法模型和信息量的办法,结合情感词的上下文语境,采用自适应的办法对情感词的情感范围进行情感极性的计算,提高了长评论文本的情感极性准确率。与现有的情感词典分词的方法相比,达到了更好的效果。
展开更多
关键词
情感分析
相干机制
n元语法模型
神经网络
自然语言处理
在线阅读
下载PDF
职称材料
题名
基于主题N元语法模型的科技报告主题分析
被引量:
2
1
作者
安欣
徐硕
机构
北京林业大学经济与管理学院
北京工业大学经济与管理学院北京现代制造业发展研究基地
出处
《农业图书情报》
2019年第6期21-30,共10页
基金
广东省自然科学基金项目“面向生物医药领域的前沿技术预判方法论与模型构建研究”(项目编号:2018A030313695)
文摘
作为科技情报的重要载体之一,科技报告可以反映科技发展的脉络,可以揭示科技前沿的动态,甚至可以洞察科技发展的趋势等。中国科技报告的开发利用研究目前主要集中在书本型科技报告或电子出版物的出版发行、数据库建设、服务方式和知识产权等方面,在深度数据挖掘方面的研究工作相对较少。笔者尝试利用主题N元语法模型对科技报告进行领域深层主题分析,为了确定特定领域科技报告的主题数目,笔者借助动态规划的思想针对主题N元语法模型提出了困惑度的有效计算方法。最后,以肿瘤领域1344条科技报告为实验数据,揭示了以“分子机制/肿瘤细胞”和“系统生物学/关键方法”为代表的70个主题,验证了利用主题N元语法模型揭示科技报告领域深层主题的可行性和有效性。
关键词
科技报告
主题
n元语法模型
主题分析
困惑度
热力图
Keywords
scie
n
tific a
n
d tech
n
ical reports
topical
n
-grams model
topical a
n
alysis
perplexity
heat map
分类号
G322 [文化科学]
在线阅读
下载PDF
职称材料
题名
基于n元语法模型的领域语音指令识别
被引量:
1
2
作者
吴应中
朱华勇
李杰
机构
国防科学技术大学机电工程与自动化学院
出处
《微计算机信息》
2009年第14期234-236,共3页
文摘
本文采用一种音素匹配法结合改进了的n元语法模型的方法,对语音指令进行理解。指令按照结构划分类别,通过提取其中关键要素来获取指令语义。音素匹配法可以提取指令中部分或全部要素;对于指令中未识别的要素则根据已正确识别的部分,采用改进的n元语法模型进行推测。实验表明该方法取得了较好的效果,并在原有的基础上有一定的提高。
关键词
自然语言理解
音素匹配
n元语法模型
指令理解
Keywords
n
ature la
n
guage u
n
dersta
n
di
n
g
pho
n
eme-match
n
-gram model
comma
n
d u
n
dersta
n
di
n
g
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于N-Gram模型的高速汉字编码识别系统
被引量:
4
3
作者
李继锋
刘群
机构
中国科学院计算技术研究所软件研究室
出处
《计算机工程与应用》
CSCD
北大核心
2004年第3期39-41,177,共4页
基金
国家863高技术研究发展计划资助(编号:2002AA142110)
文摘
该文提出了一个应用n元语法模型(N-Gram)自动识别文档中汉字编码的方法,并介绍了一个已投入使用的汉字编码自动识别系统的设计和具体实现。该系统采用的是以字为基本单位的一元语法模型Uni-Gram,建立在语料库的基础上,仅用输入前N个字的字频计算输入串的生成概率,可以高速、准确识别。
关键词
编码识别
n元语法模型
一
元
语法
模型
n
—Gram
模型
自动识别文档
汉字编码
Keywords
Codeset Recog
n
izi
n
g,
n
-Gram,U
n
i-Gram
分类号
TP391.43 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种不需分词的中文文本分类方法
被引量:
5
4
作者
许云
樊孝忠
张锋
机构
北京理工大学信息科学技术学院计算机科学工程系
出处
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2005年第9期778-781,共4页
基金
云南省信息技术基金资助项目(2002IT03)
文摘
提出了一种不需分词的n元语法文本分类方法.与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了可能造成有用信息丢失的特征选择过程.由于字的数量远小于词的数量,所以该分类方法与其它在词级别上的分类方法相比,有效地降低了数据稀疏带来的影响.系统地研究了模型中的关键因素以及它们对分类结果的影响.使用中文TREC提供的数据进行实验,结果表明,综合评价指标Fβ=1达到86.8%.
关键词
文本分类
分词
n元语法模型
Keywords
text classificatio
n
word segme
n
tatio
n
n
-gram model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
Web问答系统中问句理解的研究
被引量:
3
5
作者
苏斐
高德利
叶晨
机构
中国石油大学(北京)石油工程学院
中国石油信息技术服务中心
出处
《测试技术学报》
2012年第3期207-212,共6页
文摘
对问答系统中的问句理解技术进行了深入研究,提出了对问句信息进行深层挖掘形成问句表征.对问句进行分词、去停用词等预处理;结合FAQ库和网络对问句进行关键词扩展,以网络为语料库,利用N元语法模型对问句中的新词进行识别,利用规则的方法对问句进行分类;利用原始关键词+扩展词+新词+类别的形式对问句的信息进行表征.基于上述理论实现一个问答系统并进行了验证,实验表明:文中的问句理解方法能有效改善系统的性能.
关键词
问句理解
关键词提取
新词识别
预处理
关键词扩展
n元语法模型
Keywords
questio
n
u
n
dersta
n
di
n
g
key words extracti
n
g
n
ew words ide
n
tifyi
n
g
preprocessi
n
g
key word expa
n
sio
n
n
-gram grammar
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
独立于语种的文本分类方法
6
作者
陈林
杨丹
机构
重庆大学软件学院
出处
《计算机工程与科学》
CSCD
2008年第6期128-130,139,共4页
文摘
本文提出了一种独立于语种不需分词的文本分类方法。与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了特征选择和大量预处理过程。我们系统地研究了模型中的关键因素以及它们对分类结果的影响,并详细介绍了评价方法。该文本分类方法已经在中文和英文两个语种上得到实现,并获得了较好的分类性能。
关键词
文本分类
n元语法模型
语种
Keywords
text classificatio
n
n
-gram model
la
n
guage
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于相干机制的评论情感分析及长文本的情感极性探讨
7
作者
黄人伟
机构
江西理工大学
出处
《移动信息》
2020年第3期78-79,共2页
文摘
随着人工智能领域的快速发展,智能化的评论数据分析成为用户生成内容分析的一大研究热点。在实际评论过程中,由于评论者的素质差异及评论用语的随意性,使部分评论文本相干性不强且情感词模糊。本文以亚马逊商品评论数据集作为样本研究数据,建立分析模型对钉钉评论数据进行评论相干性和情感极性的分析,提出基于相干机制的评论数据处理模型,对评论长度较长的评论,使用N元语法模型和信息量的办法,结合情感词的上下文语境,采用自适应的办法对情感词的情感范围进行情感极性的计算,提高了长评论文本的情感极性准确率。与现有的情感词典分词的方法相比,达到了更好的效果。
关键词
情感分析
相干机制
n元语法模型
神经网络
自然语言处理
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于主题N元语法模型的科技报告主题分析
安欣
徐硕
《农业图书情报》
2019
2
在线阅读
下载PDF
职称材料
2
基于n元语法模型的领域语音指令识别
吴应中
朱华勇
李杰
《微计算机信息》
2009
1
在线阅读
下载PDF
职称材料
3
基于N-Gram模型的高速汉字编码识别系统
李继锋
刘群
《计算机工程与应用》
CSCD
北大核心
2004
4
在线阅读
下载PDF
职称材料
4
一种不需分词的中文文本分类方法
许云
樊孝忠
张锋
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2005
5
在线阅读
下载PDF
职称材料
5
Web问答系统中问句理解的研究
苏斐
高德利
叶晨
《测试技术学报》
2012
3
在线阅读
下载PDF
职称材料
6
独立于语种的文本分类方法
陈林
杨丹
《计算机工程与科学》
CSCD
2008
0
在线阅读
下载PDF
职称材料
7
基于相干机制的评论情感分析及长文本的情感极性探讨
黄人伟
《移动信息》
2020
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部