期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
向上学习方法改进移进-归约中文句法分析 被引量:2
1
作者 朱慕华 王会珍 朱靖波 《中文信息学报》 CSCD 北大核心 2015年第2期33-39,共7页
基于移进-归约的句法分析系统具有线性的时间复杂度,因此在大规模句法分析任务中具有特别实际的意义。然而目前移进-归约句法分析系统的性能远低于领域内最好的句法分析器,例如,伯克利句法分析器。该文研究如何利用向上学习和无标注数... 基于移进-归约的句法分析系统具有线性的时间复杂度,因此在大规模句法分析任务中具有特别实际的意义。然而目前移进-归约句法分析系统的性能远低于领域内最好的句法分析器,例如,伯克利句法分析器。该文研究如何利用向上学习和无标注数据改进移进-归约句法分析系统,使之尽可能接近伯克利句法分析器的性能。我们首先应用伯克利句法分析器对大规模的无标注数据进行自动分析,然后利用得到的自动标注数据作为额外的训练数据改进词性标注系统和移进-归约句法分析器。实验结果表明,向上学习方法和无标注数据使移进-归约句法分析的性能提高了2.3%,达到82.4%。这个性能与伯克利句法分析器的性能可比。与此同时,该文最终得到的句法分析系统拥有明显的速度优势(7倍速度于伯克利句法分析器)。 展开更多
关键词 中文句法分析 移进-归约分析 伯克利句法分析器 向上学习 无标注数据
在线阅读 下载PDF
基于领域词典的文本特征表示 被引量:23
2
作者 陈文亮 朱靖波 +1 位作者 朱慕华 姚天顺 《计算机研究与发展》 EI CSCD 北大核心 2005年第12期2155-2160,共6页
为提高文本分类性能,提出一种结合机器学习和领域词典的文本特征表示方法·基于领域词典的文本特征表示方法可以增强文本特征表示能力,并降低文本特征空间维数,但是领域词典存在覆盖度不足的问题·为此,提出一种学习模型———... 为提高文本分类性能,提出一种结合机器学习和领域词典的文本特征表示方法·基于领域词典的文本特征表示方法可以增强文本特征表示能力,并降低文本特征空间维数,但是领域词典存在覆盖度不足的问题·为此,提出一种学习模型———自划分模型———来解决这个覆盖度不足的问题·实验结果表明,采用基于自划分模型的领域特征属性作为文本特征,可以提高文本分类性能,特别是特征数目少的情况下,该方法表现出很好的分类效果·相对于传统词文本特征方法,在特征数为500时分类的F1值提高6·58%· 展开更多
关键词 文本分类 知识获取 领域知识 文本表示
在线阅读 下载PDF
基于领域类别信息C-value的多词串自动抽取 被引量:7
3
作者 李超 王会珍 +2 位作者 朱慕华 张俐 朱靖波 《中文信息学报》 CSCD 北大核心 2010年第1期94-98,共5页
该本的多词串抽取是自然语言处理领域一项重要的研究内容。该文提出了一种多类别C-value(Multi-Class C-value)方法,利用多词串在不同领域的分布信息改善领域相关的多词串抽取的性能。在汽车、科技和旅行三个领域的数据上进行实验,评价... 该本的多词串抽取是自然语言处理领域一项重要的研究内容。该文提出了一种多类别C-value(Multi-Class C-value)方法,利用多词串在不同领域的分布信息改善领域相关的多词串抽取的性能。在汽车、科技和旅行三个领域的数据上进行实验,评价多词串的准确率,在top-100级别上,较传统的C-value方法在三个领域中分别提高了12、12和13个百分点。实验结果验证了方法的有效性。 展开更多
关键词 计算机应用 中文信息处理 多词串抽取 多类别C-value 领域信息
在线阅读 下载PDF
基于Bootstrapping的文本分类模型 被引量:6
4
作者 陈文亮 朱慕华 +1 位作者 朱靖波 姚天顺 《中文信息学报》 CSCD 北大核心 2005年第2期86-92,共7页
本文提出一种基于Bootstrapping的文本分类模型 ,该模型采用最大熵模型作为分类器 ,从少量的种子集出发 ,自动学习更多的文本作为新的种子样本 ,这样不断学习来提高最大熵分类器的文本分类性能。文中提出一个权重因子来调整新的种子样... 本文提出一种基于Bootstrapping的文本分类模型 ,该模型采用最大熵模型作为分类器 ,从少量的种子集出发 ,自动学习更多的文本作为新的种子样本 ,这样不断学习来提高最大熵分类器的文本分类性能。文中提出一个权重因子来调整新的种子样本在分类器训练过程中的权重。实验结果表明 ,在相同的手工训练语料的条件下 ,与传统的文本分类模型相比这种基于Bootstrapping的文本分类模型具有明显优势 ,仅使用每类10 0篇种子训练集 ,分类结果的F1值为 70 5 6 % ,比传统模型高出 4 70 %。该模型通过使用适当的权重因子可以更好改善分类器的训练效果。 展开更多
关键词 计算机应用 中文信息处理 文本分类 最大熵模型 权重因子
在线阅读 下载PDF
语义角色标注增强的隐式篇章关系识别
5
作者 吴一珩 李军辉 朱慕华 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期1005-1015,共11页
[目的]为了改善因将隐式篇章关系识别(implicit discourse relation recognition,IDRR)描述为文本分类任务,提出了一种新颖的IDRR方法.[方法]将IDRR视为文本生成任务并直接生成篇章单元对的连接词,随后生成的连接词被准确无歧义地映射... [目的]为了改善因将隐式篇章关系识别(implicit discourse relation recognition,IDRR)描述为文本分类任务,提出了一种新颖的IDRR方法.[方法]将IDRR视为文本生成任务并直接生成篇章单元对的连接词,随后生成的连接词被准确无歧义地映射到唯一篇章关系.具体地,首先设计了可以将无歧义性连接词转化为对应篇章关系的连接词-关系映射表;然后介绍了两种不同的连接词替换策略用于替换训练样例中的歧义性连接词;最后,将IDRR视作一个序列到序列的任务,其中目标端序列由基于语义角色标注增强的篇章单元对和两者之间的连接词组成.[结果]基于英语PDTB和中文CDTB的实验结果表明本文提出的方法达到了最先进的性能.[结论]本文方法创新性地将IDRR视为文本生成任务,并通过序列到序列模型显著提升了隐式篇章关系识别的效果,为隐含信息的精确捕捉提供了新的解决方案. 展开更多
关键词 隐式篇章关系识别 序列到序列模型 语句角色标注增强 连接词生成
在线阅读 下载PDF
面向移进—归约句法分析器的单模型系统整合算法 被引量:5
6
作者 马骥 朱慕华 +1 位作者 肖桐 朱靖波 《中文信息学报》 CSCD 北大核心 2012年第3期9-15,共7页
该文提出了一种面向移进—归约句法分析器的单模型系统整合算法。在训练阶段,该方法通过调整训练数据的分布,来构建用于整合的多个移进—归约句法分析器。在解码阶段,该方法首先使用各个移进—归约句法分析器对待分析的句子进行句法分析... 该文提出了一种面向移进—归约句法分析器的单模型系统整合算法。在训练阶段,该方法通过调整训练数据的分布,来构建用于整合的多个移进—归约句法分析器。在解码阶段,该方法首先使用各个移进—归约句法分析器对待分析的句子进行句法分析,然后利用一个线性模型对各句法分析器输出的句法树进行评分,从中选出得分最高的句法树作为最终结果。该文中的实验是在宾州英文树库上进行的。实验结果表明,该文中的方法能够显著改善基准系统的性能。 展开更多
关键词 句法分析 系统整合 移进—归约句法分析器
在线阅读 下载PDF
基于多视角对比学习的隐式篇章关系识别
7
作者 吴一珩 李军辉 朱慕华 《计算机工程与科学》 CSCD 北大核心 2024年第4期716-724,共9页
隐式篇章关系识别IDRR的相关工作集中在篇章单元编码器的设计上。将对比学习引入到IDRR,以此获得区分度更高的篇章单元表征。具体地,首先使用一个轻量的IDRR模型;然后为了学习到更好的篇章单元表征,分别从样例层级、批层级和群层级,探索... 隐式篇章关系识别IDRR的相关工作集中在篇章单元编码器的设计上。将对比学习引入到IDRR,以此获得区分度更高的篇章单元表征。具体地,首先使用一个轻量的IDRR模型;然后为了学习到更好的篇章单元表征,分别从样例层级、批层级和群层级,探索了3种不同视角的对比学习方法在IDRR中的应用;最后本文将多视角对比学习目标联合IDRR同时进行训练。本文提出的方法几乎不增加训练时间,而且只引入少量额外参数。基于PDTB 2.0的实验结果表明该方法达到了最优性能。 展开更多
关键词 隐式篇章关系识别 多视角 对比学习 联合学习
在线阅读 下载PDF
利用词的分布式表示改进作文跑题检测 被引量:6
8
作者 陈志鹏 陈文亮 朱慕华 《中文信息学报》 CSCD 北大核心 2015年第5期178-184,203,共8页
作文跑题检测任务的核心问题是文本相似度计算。传统的文本相似度计算方法一般基于向量空间模型,即把文本表示成高维向量,再计算文本之间的相似度。这种方法只考虑文本中出现的词项(词袋模型),而没有利用词项的语义信息。该文提出一种... 作文跑题检测任务的核心问题是文本相似度计算。传统的文本相似度计算方法一般基于向量空间模型,即把文本表示成高维向量,再计算文本之间的相似度。这种方法只考虑文本中出现的词项(词袋模型),而没有利用词项的语义信息。该文提出一种新的文本相似度计算方法:基于词扩展的文本相似度计算方法,将词袋模型(Bag-of-Words)方法与词的分布式表示相结合,在词的分布式表示向量空间中寻找与文本出现的词项语义上相似的词加入到文本表示中,实现文本中单词的扩展。然后对扩展后的文本计算相似度。该文将这种方法运用到英文作文的跑题检测中,构建一套跑题检测系统,并在一个真实数据中进行测试。实验结果表明该文的跑题检测系统能有效识别跑题作文,性能明显高于基准系统。 展开更多
关键词 文本相似度 词分布式表示 跑题检测 文本表示
在线阅读 下载PDF
中西方隐私性话题的跨文化差异分析 被引量:2
9
作者 朱慕华 顾军 《品位·经典》 2020年第1期40-43,共4页
本文从隐私的起源与发展入手,运用对比的研究方法,选取了以汉语为代表的中国文化和以英语为代表的西方文化,从关于个人信息的隐私性话题、关于个人私事的隐私性话题以及关于个人领域的隐私性话题三个方面对中西方应对隐私性话题的差异... 本文从隐私的起源与发展入手,运用对比的研究方法,选取了以汉语为代表的中国文化和以英语为代表的西方文化,从关于个人信息的隐私性话题、关于个人私事的隐私性话题以及关于个人领域的隐私性话题三个方面对中西方应对隐私性话题的差异进行分析,以期对中西方隐私性话题的跨文化交际的实践起到促进作用。 展开更多
关键词 中西方 隐私性话题 跨文化交际
在线阅读 下载PDF
浅析电视新闻采访的准备与现场沟通艺术 被引量:7
10
作者 朱慕华 《长春教育学院学报》 2012年第10期27-28,共2页
成功的电视新闻采访不仅需要做好充分的准备,在采访之前明确采访对象和采访目的,了解采访背景,抓住新闻点,进而做好采编计划,做好提纲,除此之外,还要掌握一定的沟通技巧,把握好自己的风格和角色。只有这样,才能为顺利完成采访工作打下... 成功的电视新闻采访不仅需要做好充分的准备,在采访之前明确采访对象和采访目的,了解采访背景,抓住新闻点,进而做好采编计划,做好提纲,除此之外,还要掌握一定的沟通技巧,把握好自己的风格和角色。只有这样,才能为顺利完成采访工作打下坚实的基础。 展开更多
关键词 新闻采访 准备 沟通技巧
在线阅读 下载PDF
央视《谢天谢地你来啦》节目特色及发展分析 被引量:1
11
作者 朱慕华 《海南广播电视大学学报》 2012年第3期57-63,共7页
《谢天谢地你来啦》尽管开播时间不长,但吸引了广大观众目光。作为一档海外引进的大型明星戏剧表演真人秀节目,它通过节目组的本土化调整,用文艺事业工作者的良心为观众交上一份能够"让人高雅地笑"的答卷。它以简单的形式、... 《谢天谢地你来啦》尽管开播时间不长,但吸引了广大观众目光。作为一档海外引进的大型明星戏剧表演真人秀节目,它通过节目组的本土化调整,用文艺事业工作者的良心为观众交上一份能够"让人高雅地笑"的答卷。它以简单的形式、精致的布景、优秀的演员、出色的主持人、巧妙的剧本、内行的评委、高雅的定位为特色和优势,一举击败无数曾经占据周六晚10:30时间的电视节目和电视连续剧。然而,年轻的节目能否长久,还需要时间考验。目前,一些影响节目发展的瑕疵已初现端倪。未来,《谢天谢地你来啦》或许将做一些调整,以更加成熟姿态,引领当代电视综艺节目。 展开更多
关键词 综艺节目 谢天谢地你来啦 简单 高雅 智慧
在线阅读 下载PDF
融合源端句法和语义角色信息的AMR解析 被引量:3
12
作者 葛东来 李军辉 +2 位作者 朱慕华 李寿山 周国栋 《中文信息学报》 CSCD 北大核心 2019年第8期36-45,共10页
序列到序列(seq2seq)的框架可以应用到抽象语义表示(AMR)解析任务中,把AMR解析当作一个从源端句子到目标端AMR图的翻译任务。然而,以前的工作通常把源端句子表示为一个单词序列,忽略了句子内部潜藏的句法和语义角色信息。基于seq2seq框... 序列到序列(seq2seq)的框架可以应用到抽象语义表示(AMR)解析任务中,把AMR解析当作一个从源端句子到目标端AMR图的翻译任务。然而,以前的工作通常把源端句子表示为一个单词序列,忽略了句子内部潜藏的句法和语义角色信息。基于seq2seq框架,该文提出了一个直接而有效的融合句法和语义角色信息的AMR解析方法。实验结果表明,该文的方法在AMR英文标准数据集上取得了6.7%的显著提升。最后,该文从多个角度深入分析了源端的句法和语义角色信息是如何对AMR解析提供帮助的。分析表明,词性信息和subword技术对AMR解析性能提升的贡献最大,上层句法和语义角色信息次之。 展开更多
关键词 AMR解析 序列到序列模型 句法 语义角色
在线阅读 下载PDF
基于多任务预训练的AMR文本生成研究 被引量:2
13
作者 徐东钦 李军辉 +1 位作者 朱慕华 周国栋 《软件学报》 EI CSCD 北大核心 2021年第10期3036-3050,共15页
抽象语义表示(abstract meaning representation,简称AMR)文本生成的任务是给定AMR图,生成与其语义一致的文本.相关工作表明,人工标注语料的规模大小直接影响了AMR文本生成的性能.为了降低对人工标注语料的依赖,提出了基于多任务预训练... 抽象语义表示(abstract meaning representation,简称AMR)文本生成的任务是给定AMR图,生成与其语义一致的文本.相关工作表明,人工标注语料的规模大小直接影响了AMR文本生成的性能.为了降低对人工标注语料的依赖,提出了基于多任务预训练的AMR文本生成方法.特别地,基于大规模自动标注AMR语料,提出与AMR文本生成任务相关的3个预训练任务,分别是AMR降噪自编码、句子降噪自编码以及AMR文本生成任务本身.此外,基于预训练模型,在朴素微调方法的基础上,进一步提出了基于多任务训练的微调方法,使得最终模型不仅适用于AMR文本生成,同时还适用于预训练任务.基于两个AMR标准数据集的实验结果表明:使用0.39M自动标注数据,提出的预训练方法能够大幅度提高AMR文本生成的性能,在AMR2.0和AMR3.0上分别提高了12.27和7.57个BLEU值,性能分别达到40.30和38.97.其中,在AMR2.0上的性能为目前报告的最优值,在AMR3.0上的性能为目前为止首次报告的性能. 展开更多
关键词 AMR AMR文本生成 多任务预训练 序列到序列模型
在线阅读 下载PDF
基于协同训练的电商领域短语挖掘 被引量:2
14
作者 许勇 刘井平 +1 位作者 肖仰华 朱慕华 《计算机工程》 CAS CSCD 北大核心 2020年第4期70-76,84,共8页
电商领域的文本通常不遵循通用领域文本的表达方式,导致传统短语挖掘方法在电商领域文本中的挖掘精度较低.为此,提出一种基于协同训练的电商领域短语挖掘方法.通过基于语义特征的短语分类模型来有效检测电商领域文本中的反序表达,构建... 电商领域的文本通常不遵循通用领域文本的表达方式,导致传统短语挖掘方法在电商领域文本中的挖掘精度较低.为此,提出一种基于协同训练的电商领域短语挖掘方法.通过基于语义特征的短语分类模型来有效检测电商领域文本中的反序表达,构建协同训练的短语挖掘框架,以降低领域语料中标注训练数据的成本,在此基础上,利用Stacking方法集成统计模型和语义模型的优点,提升模型整体挖掘性能.在淘宝网查询语料上的实验结果表明,相比于ClassPhrase、AutoPhrase方法,该方法具有更高的精度和召回率. 展开更多
关键词 集成学习 短语挖掘 协同训练 深度学习 命名实体识别
在线阅读 下载PDF
辅导员视角下护理类医学生就业指导策略探析
15
作者 朱慕华 朱怀冰 +1 位作者 朱炳成 张桂东 《中文科技期刊数据库(全文版)社会科学》 2023年第6期69-72,共4页
就业乃民生之本,近年来国内外经济形势风云变幻,随着我国高校毕业生人数逐年激增,护理类医学生面临着严峻的就业形势。辅导员作为高校就业指导工作的主力大军,优化就业指导策略至关重要。本文主要分析了当前就业大环境和护理类医学生的... 就业乃民生之本,近年来国内外经济形势风云变幻,随着我国高校毕业生人数逐年激增,护理类医学生面临着严峻的就业形势。辅导员作为高校就业指导工作的主力大军,优化就业指导策略至关重要。本文主要分析了当前就业大环境和护理类医学生的就业形势,剖析了辅导员在护理类医学生就业指导工作中面临的几大难题,并提出了优化辅导员对护理类医学生就业指导策略的几点思考。 展开更多
关键词 护理医学生 辅导员 就业指导
在线阅读 下载PDF
融媒体时代背景下高校党建工作品牌化建设研究
16
作者 朱慕华 李旺泽 +1 位作者 张璐芳 田立群 《中文科技期刊数据库(全文版)社会科学》 2022年第12期201-204,共4页
随着新时代的不断发展,通过高校党建工作品牌化建设来持续发展党建工作,这将有助于提升高校基层党组织的凝聚力、号召力和影响力,但由于目前党建品牌化建设仍出现时间短、研究少的现实情况,且工作经验不足现象时有发生,在高校党建工作... 随着新时代的不断发展,通过高校党建工作品牌化建设来持续发展党建工作,这将有助于提升高校基层党组织的凝聚力、号召力和影响力,但由于目前党建品牌化建设仍出现时间短、研究少的现实情况,且工作经验不足现象时有发生,在高校党建工作品牌化建设方面,仍须相关党员干部进行深入地探索、思考和创新。本文从简单分析高校党建工作品牌化建设的概念为入手点,对高校党建工作品牌化建设的现状进行了简单的解释,着重分析了高校党建工作品牌化建设的正面的、积极的作用及高校党建工作品牌化建设的必要性,最后本文以如何深化高校党建工作品牌化建设作为重点,进行了较为详细、全面的阐述。 展开更多
关键词 融媒体 高校党建工作 品牌化建设
在线阅读 下载PDF
浅析当代企业加强工会思想政治研究的策略 被引量:7
17
作者 朱慕华 《才智》 2014年第12期303-303,共1页
本文通过对企业工会的简要介绍,提出了加强企业工会思想政治教育的策略,点明企业工会思想政治教育的重要作用,为企业与员工和谐发展提供了一个奋斗目标。
关键词 职工 工会 企业
原文传递
利用图像描述与知识图谱增强表示的视觉问答 被引量:4
18
作者 王屹超 朱慕华 +3 位作者 许晨 张琰 王会珍 朱靖波 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第5期900-907,共8页
视觉问答作为多模态任务,需要深度理解图像和文本问题从而推理出答案。然而在许多情况下,仅在图像和问题上进行简单推理难以得到正确的答案,事实上还有其他有效的信息如图像描述、外部知识等可以被利用。该文提出了利用图像描述和外部... 视觉问答作为多模态任务,需要深度理解图像和文本问题从而推理出答案。然而在许多情况下,仅在图像和问题上进行简单推理难以得到正确的答案,事实上还有其他有效的信息如图像描述、外部知识等可以被利用。该文提出了利用图像描述和外部知识增强表示的视觉问答模型。该模型以问题为导向,基于协同注意力机制分别在图像和其描述上进行编码,并且利用知识图谱嵌入,将外部知识编码到模型当中,丰富了模型的特征表示,增强了模型的推理能力。在OKVQA数据集上的实验结果表明,该方法相比基线方法有1.71%的准确率提升,与已有的主流模型相比也有1.88%的准确率提升,证明了该方法的有效性。 展开更多
关键词 视觉问答 多模态融合 知识图谱 图像描述
原文传递
试析地方电视台时政新闻报道的几个要点
19
作者 朱慕华 《才智》 2009年第1期195-195,共1页
时政新闻报道的主角虽然是地方党委和政府的主要领导,但主题却是地方出台的或即将出台的事关百姓切身利益的方针政策、法规措施,百姓是最终的受益者。基于此,地方电视台时政新闻报道要达到五点要求:即有政治意识。
关键词 时政新闻报道 电视语言 百姓切身利益 会议新闻 可看性 新闻点 大局意识 社会新闻 鲜活性 在现场
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部