对Web of Science核心合集数据库中数据科学相关主题文献进行检索,利用CiteSpace软件对检索到的数据进行作者、机构的合作网络分析,关键词共现网络分析以及文献共被引分析。基于知识图谱探析近年来国外数据科学研究现状,在此基础之上,...对Web of Science核心合集数据库中数据科学相关主题文献进行检索,利用CiteSpace软件对检索到的数据进行作者、机构的合作网络分析,关键词共现网络分析以及文献共被引分析。基于知识图谱探析近年来国外数据科学研究现状,在此基础之上,结合对文献内容的研究分析,提出数据科学研究面临的一些问题以及未来的发展趋势。展开更多
随着大量科研论文全文本的出现,如何从中挖掘相应的知识不仅有利于学术文献的深度知识组织而且有益于学术文献的精准检索。而识别学术文本的结构是进行上述探究的基础,因为结构的识别有助于从更深层次或者偏重语义的角度理解学术文本,...随着大量科研论文全文本的出现,如何从中挖掘相应的知识不仅有利于学术文献的深度知识组织而且有益于学术文献的精准检索。而识别学术文本的结构是进行上述探究的基础,因为结构的识别有助于从更深层次或者偏重语义的角度理解学术文本,从而促进学术文本挖掘研究的发展。本文以学术文本的不同结构功能为研究对象,以Journal of the Association for Information Science and Technology(JASIST)上发表的1579篇论文为数据集,进行双向长短时记忆神经网络、支持向量机和条件随机场三种模型上的预实验,并对比实验结果的性能,最终确定利用条件随机场模型做进一步探究。利用条件随机场模型,本文将学术文本结构功能识别问题转化为对句子单元的序列标注问题,寻找最优识别模型并探究不同特征对结构功能识别的影响,最终获得开放测试的调和平均值为92.88%的结构整体识别效果。实验结果表明,章节标题中词汇信息和章节内容的特征词汇信息对学术文本的功能结构识别起到巨大作用,可以达到令人满意的效果,而结构的长度特征则干扰条件随机场方法的性能。在最后,本文对学术文本结构功能识别出错原因进行总结,指出进一步探讨的问题和方向。展开更多
K-栅栏覆盖是有向传感器网络的研究热点之一.概率感知模型要比0-1模型更贴近实际.而基于概率感知模型的栅栏覆盖还鲜有研究.根据感知概率阈值和感知距离要求,确定节点的虚拟半径.提出一种二元概率栅栏覆盖模型.在这个模型中,相邻2个节...K-栅栏覆盖是有向传感器网络的研究热点之一.概率感知模型要比0-1模型更贴近实际.而基于概率感知模型的栅栏覆盖还鲜有研究.根据感知概率阈值和感知距离要求,确定节点的虚拟半径.提出一种二元概率栅栏覆盖模型.在这个模型中,相邻2个节点的虚拟感知圆两两相切.在此基础上提出了最少节点的概率栅栏构建算法(construction of probabilistic barrier of minimum node,CPBMN).首先根据二元概率栅栏模型确定节点的目标位置,再通过匈牙利算法选用移动距离之和最少的移动节点移动到目标位置形成栅栏覆盖,缺少移动节点的子区域,选择附近区域的剩余移动节点修补形成1-栅栏覆盖.水平相邻的2个子区域之间构建竖直栅栏,这些子区域的概率1-栅栏合起来构成整个区域的概率K-栅栏覆盖.仿真结果证明:该方法能够有效形成概率栅栏,最多比其他栅栏构建算法节省70%能耗.展开更多
文摘对Web of Science核心合集数据库中数据科学相关主题文献进行检索,利用CiteSpace软件对检索到的数据进行作者、机构的合作网络分析,关键词共现网络分析以及文献共被引分析。基于知识图谱探析近年来国外数据科学研究现状,在此基础之上,结合对文献内容的研究分析,提出数据科学研究面临的一些问题以及未来的发展趋势。
文摘随着大量科研论文全文本的出现,如何从中挖掘相应的知识不仅有利于学术文献的深度知识组织而且有益于学术文献的精准检索。而识别学术文本的结构是进行上述探究的基础,因为结构的识别有助于从更深层次或者偏重语义的角度理解学术文本,从而促进学术文本挖掘研究的发展。本文以学术文本的不同结构功能为研究对象,以Journal of the Association for Information Science and Technology(JASIST)上发表的1579篇论文为数据集,进行双向长短时记忆神经网络、支持向量机和条件随机场三种模型上的预实验,并对比实验结果的性能,最终确定利用条件随机场模型做进一步探究。利用条件随机场模型,本文将学术文本结构功能识别问题转化为对句子单元的序列标注问题,寻找最优识别模型并探究不同特征对结构功能识别的影响,最终获得开放测试的调和平均值为92.88%的结构整体识别效果。实验结果表明,章节标题中词汇信息和章节内容的特征词汇信息对学术文本的功能结构识别起到巨大作用,可以达到令人满意的效果,而结构的长度特征则干扰条件随机场方法的性能。在最后,本文对学术文本结构功能识别出错原因进行总结,指出进一步探讨的问题和方向。
文摘K-栅栏覆盖是有向传感器网络的研究热点之一.概率感知模型要比0-1模型更贴近实际.而基于概率感知模型的栅栏覆盖还鲜有研究.根据感知概率阈值和感知距离要求,确定节点的虚拟半径.提出一种二元概率栅栏覆盖模型.在这个模型中,相邻2个节点的虚拟感知圆两两相切.在此基础上提出了最少节点的概率栅栏构建算法(construction of probabilistic barrier of minimum node,CPBMN).首先根据二元概率栅栏模型确定节点的目标位置,再通过匈牙利算法选用移动距离之和最少的移动节点移动到目标位置形成栅栏覆盖,缺少移动节点的子区域,选择附近区域的剩余移动节点修补形成1-栅栏覆盖.水平相邻的2个子区域之间构建竖直栅栏,这些子区域的概率1-栅栏合起来构成整个区域的概率K-栅栏覆盖.仿真结果证明:该方法能够有效形成概率栅栏,最多比其他栅栏构建算法节省70%能耗.