期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
基于极化SAR图像的建筑区提取方法研究 被引量:2
1
作者 江畅 何秀凤 +3 位作者 严汝琳 孙喆 牛雨 李帅 《航天返回与遥感》 CSCD 北大核心 2017年第2期72-81,共10页
建筑区提取对于城市规划和灾害评估具有重要的作用。文章提出融合极化方位角补偿的散射模型提取建筑区。首先对极化SAR图像进行极化补偿处理,使得建筑物的散射成分增强,然后融合极化分解得到的散射分量和纹理特征参数作为建筑区提取依据... 建筑区提取对于城市规划和灾害评估具有重要的作用。文章提出融合极化方位角补偿的散射模型提取建筑区。首先对极化SAR图像进行极化补偿处理,使得建筑物的散射成分增强,然后融合极化分解得到的散射分量和纹理特征参数作为建筑区提取依据,最后使用面向对象的提取方法进行建筑区提取。采用美国San Francisco地区L波段星载AIRSAR数据和德国Oberpfaffenhofen地区L波段机载ESAR数据分别进行实验验证。结果表明,文中方法较好地识别并提取了建筑区,提高了建筑区的提取精度,可用于受灾建筑区提取以及城市建筑区信息获取。 展开更多
关键词 极化合成孔径雷达 建筑区提取 极化方位角补偿 纹理特征
在线阅读 下载PDF
浅谈软件工程数据挖掘研究分析
2
作者 王军 《中文科技期刊数据库(文摘版)工程技术》 2018年第1期00270-00271,共2页
近年来,随着科技和经济的不断发展,一种基于软件工程的数据挖掘技术得到了广泛应用。计算机软件系统规模的不断壮大,以及构成的日益复杂,为软件工程的管理和控制活动带来了困难,而应运而生的数据挖掘技术为上述难题提供了妥善的解决方... 近年来,随着科技和经济的不断发展,一种基于软件工程的数据挖掘技术得到了广泛应用。计算机软件系统规模的不断壮大,以及构成的日益复杂,为软件工程的管理和控制活动带来了困难,而应运而生的数据挖掘技术为上述难题提供了妥善的解决方法。其不仅可以便捷的获取有效信息,而且为知识智能型软件工程的实现提供了机遇。本文结合软件工程数据挖掘的相关概念,为将软件工程数据挖掘应用到计算机软件测试中提出了合理的意见和建议。 展开更多
关键词 数据挖掘 软件工程 应用
在线阅读 下载PDF
基于LSTM网络的中文地址分词法的设计与实现 被引量:6
3
作者 张文豪 卢山 程光 《计算机应用研究》 CSCD 北大核心 2018年第12期3652-3654,共3页
当前中文地址的分词法主要采用基于规则和传统机器学习的方法。这些方法需要人工长期维护词典和提取特征。为避免特征工程和减少人工维护,提出了将长短时记忆(long short-term memory,LSTM)网络和双向长短时记忆(bi-directional long sh... 当前中文地址的分词法主要采用基于规则和传统机器学习的方法。这些方法需要人工长期维护词典和提取特征。为避免特征工程和减少人工维护,提出了将长短时记忆(long short-term memory,LSTM)网络和双向长短时记忆(bi-directional long short-term memory,Bi-LSTM)网络分别应用在中文地址分词任务中,并采用四词位标注法以及增加未标记数据集的方法提升分词性能。在自建数据集上的实验结果表明,中文地址分词任务应用Bi-LSTM网络结构能得到较好的性能,在增加未标记数据集的情况下,可以有效提升模型的性能。 展开更多
关键词 中文地址 分词 卡短时记忆 未标记数据集
在线阅读 下载PDF
基于MPP-Hadoop混合架构高校数据集成系统研究 被引量:9
4
作者 邓涵元 卢山 程光 《计算机技术与发展》 2018年第8期160-163,169,共5页
随着数字化校园的建设,传统的数据集成系统在海量数据环境下数据查询和加载的效率均有所下降,且难以对非结构化、半结构化数据进行融合和分析。针对以上情况,依托高校大数据平台,从各个异构系统中抽取出数据,结合Hadoop和MPP技术的优势... 随着数字化校园的建设,传统的数据集成系统在海量数据环境下数据查询和加载的效率均有所下降,且难以对非结构化、半结构化数据进行融合和分析。针对以上情况,依托高校大数据平台,从各个异构系统中抽取出数据,结合Hadoop和MPP技术的优势,设计并实现了一个基于MPP-Hadoop混合框架的高校异构数据集成系统,融合多种不同结构数据,提升了数据查询和加载的效率。以某高校为例,从学生的门禁刷卡系统和校园网系统中抽取出学生的行为轨迹数据,载入MPP数据仓库,进行数据融合,并与传统数据仓库产品Oracle搭建的现有高校数据集成系统进行数据加载和数据查询效率方面的对比评测,验证了系统的有效性并且为学生的学习生活、心理等各方面的管理工作提供一定的技术支持和指导。 展开更多
关键词 数据集成 高校大数据 MPP HADOOP GreenPlum
在线阅读 下载PDF
社交网络用户影响力的模糊综合评价 被引量:2
5
作者 张琛 汤鲲 彭艳兵 《计算机系统应用》 2017年第12期18-24,共7页
社交网络平台信息传播迅速,为了有效地进行舆情预警,定量地评估用户在消息传播网络中重要性,将模糊综合评价方法引入用户影响力建模问题中.通过对用户在社交平台上的行为分析,构造了包含用户活跃粉丝数以及平均转发数等五项指标在内的... 社交网络平台信息传播迅速,为了有效地进行舆情预警,定量地评估用户在消息传播网络中重要性,将模糊综合评价方法引入用户影响力建模问题中.通过对用户在社交平台上的行为分析,构造了包含用户活跃粉丝数以及平均转发数等五项指标在内的评价体系.并针对传统的模糊综合评价算法在应用于计算评价指标权重方面的缺陷与不足,提出改进模糊合成算子的方法构建用户影响力评估模型.利用新浪微博社交平台上的真实数据,结合对比实验和实际评估,改进的模糊合成算子能根据需求调整权重对评价结果的影响,同时该方法能较准确地反应社交网络中用户的实际影响力. 展开更多
关键词 社交网络 用户影响力 模糊综合评价 模糊矩阵合成
在线阅读 下载PDF
词向量聚类加权Shark-Search的主题爬虫策略研究 被引量:7
6
作者 程元堃 廖闻剑 程光 《计算机与数字工程》 2018年第1期144-148,共5页
针对Shark-Search算法在主题爬虫中对于链接与主题相关性判断不够全面的问题,采取对待访问链接内容进行词向量聚类的方式,利用余弦距离表示与扩充主题词的相关性,改进了算法中对邻近链接评分的机制。实验结果表明,利用改进后的新算法在... 针对Shark-Search算法在主题爬虫中对于链接与主题相关性判断不够全面的问题,采取对待访问链接内容进行词向量聚类的方式,利用余弦距离表示与扩充主题词的相关性,改进了算法中对邻近链接评分的机制。实验结果表明,利用改进后的新算法在限定时间内能够发现更多主题相关的链接,有效提高了主题爬虫的效率。 展开更多
关键词 主题爬虫 Shark-Search 词向量聚类
在线阅读 下载PDF
基于轨迹相似度的伴随人员推荐 被引量:7
7
作者 廖闻剑 田小虎 邱秀连 《计算机系统应用》 2018年第4期157-161,共5页
移动网络和智能终端的发展使得基于优质用户的伴随人员的推荐成为互联网发展的热点之一,而伴随人员的推荐算法则是至关重要的因素.针对以往基于地理位置的用户轨迹性相似推荐算法中需基于地理位置或基站数据,且数据稀疏时推荐结果不理... 移动网络和智能终端的发展使得基于优质用户的伴随人员的推荐成为互联网发展的热点之一,而伴随人员的推荐算法则是至关重要的因素.针对以往基于地理位置的用户轨迹性相似推荐算法中需基于地理位置或基站数据,且数据稀疏时推荐结果不理想的问题,提出了基于IP场所的轨迹余弦相似度的伴随人员推荐,以更完善的IP场所数据代替地理位置数据,以一段时间的纵向日期和横向时刻分别计算余弦相似度以消除数据稀疏性问题.最后推荐出了相似度质量更高的伴随人员. 展开更多
关键词 移动轨迹 IP场所 推荐算法 余弦相似度 伴随人员
在线阅读 下载PDF
基于word2vec的网站主题分类研究 被引量:5
8
作者 程元堃 蒋言 程光 《计算机与数字工程》 2019年第1期169-173,共5页
为了对网站主题高效的进行分类,建立一种基于word2vec的分类模型。针对预先定义的财经、娱乐、军事、科技、健康、体育、教育、社会共八个主题,首先通过word2vec训练得到包含语义的词向量。根据八个主题分别列举对应的特征词,将每个主... 为了对网站主题高效的进行分类,建立一种基于word2vec的分类模型。针对预先定义的财经、娱乐、军事、科技、健康、体育、教育、社会共八个主题,首先通过word2vec训练得到包含语义的词向量。根据八个主题分别列举对应的特征词,将每个主题的特征词对应的词向量取平均作为该主题的中心词向量。对于待测网站文本,通过DBSCAN聚类提升文本的数据质量,计算文本与各主题的余弦相似度,取最大的作为该文本的所属主题。实验采用8000个文档进行测试,实验结果表明,利用该方法可以高效地对网页文本主题进行分类,有助于更好地了解人们的阅读偏好。 展开更多
关键词 网站分类 word2vec 词向量 DBSCAN 余弦相似度
在线阅读 下载PDF
基于CEP的校园推荐系统设计与实现 被引量:1
9
作者 周苾 卢山 汤鲲 《计算机技术与发展》 2018年第6期192-196,共5页
针对高校学生课外资源过载、缺少实时个性化推荐等问题,将复杂事件处理技术(CEP)运用到推荐系统中,发挥其强大的实时处理优势,对进一步提高高校个性化资源推荐系统的准确性和实时性进行了研究。将高校管理与资源推荐相结合,设计大数据... 针对高校学生课外资源过载、缺少实时个性化推荐等问题,将复杂事件处理技术(CEP)运用到推荐系统中,发挥其强大的实时处理优势,对进一步提高高校个性化资源推荐系统的准确性和实时性进行了研究。将高校管理与资源推荐相结合,设计大数据背景下的校园学辅资源推荐系统。利用复杂事件处理技术,将学生实时地理位置信息、签到信息、图书馆借阅信息、宿舍信息等四种多维、异构数据源相结合,使用EPL语言实现相应的规则关联,将简单事件流通过Esper引擎处理后形成复杂事件流,对高校学生资源推荐系统作实证分析,实现从学生基本信息数据流处理、复杂事件规则验证到相关资源推荐的整个推送过程。实验结果表明,将该系统与最常用的基于协同过滤算法的推荐系统性能作比较,实时性提升了20%,准确度提升了30%,验证了该系统具有良好的推荐效果。 展开更多
关键词 复杂事件处理 个性化推荐 资源过载 协同过滤 Esper
在线阅读 下载PDF
基于联合模型的中文社交媒体命名实体识别 被引量:2
10
作者 易黎 黄鹏 +1 位作者 彭艳兵 程光 《计算机与数字工程》 2017年第12期2402-2406,2433,共6页
随着互联网的发展,对中文社交媒体中命名实体进行识别具有重要的意义,传统的做法是采用监督学习方法,局限于标注数据的稀缺。然而,通用领域中有足够的语料库且社交媒体中的海量未标注的文本可以用于提高命名实体识别的效果。论文提出了... 随着互联网的发展,对中文社交媒体中命名实体进行识别具有重要的意义,传统的做法是采用监督学习方法,局限于标注数据的稀缺。然而,通用领域中有足够的语料库且社交媒体中的海量未标注的文本可以用于提高命名实体识别的效果。论文提出了一个联合模型,利用通用领域语料库和社交网络领域中未标注的文本进行训练。该联合模型由两个模型组成,一个是跨领域学习模型另外一个是半监督学习模型。跨领域学习基于领域的相似性学习通用领域的信息。半监督学习通过主动学习目标域内未标注的信息。该联合模型提高了命名实体识别的效果,且大大减小了人工标注语料工作。 展开更多
关键词 命名实体识别 社交媒体 跨领域学习 领域相似性 半监督学习 主动学习
在线阅读 下载PDF
基于BiLSTM和注意力机制的入侵检测 被引量:11
11
作者 舒豪 王晨 史崯 《计算机工程与设计》 北大核心 2020年第11期3042-3046,共5页
由于传统网络入侵检测方法的局限性无法满足当前网络安全需要,为提高网络入侵检测的准确率,引入机器学习算法,提出一种基于BiLSTM(bi-directional long short-term memory)和注意力机制的网络入侵检测方法。利用BiLSTM网络进行长距离依... 由于传统网络入侵检测方法的局限性无法满足当前网络安全需要,为提高网络入侵检测的准确率,引入机器学习算法,提出一种基于BiLSTM(bi-directional long short-term memory)和注意力机制的网络入侵检测方法。利用BiLSTM网络进行长距离依赖特征提取,利用DNN(deep neural network)提取更深层次的特征,引入注意力机制增加对特征重要性的计算,通过softmax分类器获得分类结果。使用NSL_KDD数据集作为实验数据,实验结果表明,相比于对比方法,该方法有效提高了入侵检测的准确率,验证了该方法的有效性。 展开更多
关键词 入侵检测 机器学习 注意力机制 双向长短期记忆 深度神经网络
在线阅读 下载PDF
探索关联规则可视化的结构化关联映射图 被引量:5
12
作者 易黎 胡雅萌 彭艳兵 《计算机应用与软件》 2017年第12期68-70,157,共4页
对于大量的高维度的交易数据,利用关联规则进行数据挖掘,用户难以进行解释和利用。主要两个原因:常规关联规则挖掘算法可产生大量关联规则;一些关联规则可部分重叠。若用户能自主选择,在关联规则挖掘中所使用的相关项集,则可解决该问题... 对于大量的高维度的交易数据,利用关联规则进行数据挖掘,用户难以进行解释和利用。主要两个原因:常规关联规则挖掘算法可产生大量关联规则;一些关联规则可部分重叠。若用户能自主选择,在关联规则挖掘中所使用的相关项集,则可解决该问题。提出一种新的视觉探索工具,结构化关联映射图,使用户能够以视觉方式找到相关项集的组。该方法使用健康检查结果数据集进行验证,并且实验结果表明具有最高2×2规则贡献的和值的结构化关联映射图有助于显著减少关联分析的复杂性,并且能够集中于搜索空间的特定区域关联规则挖掘,同时避免不相关的关联规则。 展开更多
关键词 可视化 关联规则挖掘 分层聚类 结构化关联映射图
在线阅读 下载PDF
基于聚类分析算法的海量关系数据可视化技术研究 被引量:11
13
作者 刘念 刘宇 《电子设计工程》 2018年第10期92-95,共4页
信息可视化及大数据可视化主要研究大规模非数值型信息资源的视觉展示,以达到帮助人们理解并分析数据。基于对海量的关系型数据进行有效挖掘的目的,采用将数据挖掘领域的聚类分析算法与力导引布局算法相结合的方法,提出了一种新的基于... 信息可视化及大数据可视化主要研究大规模非数值型信息资源的视觉展示,以达到帮助人们理解并分析数据。基于对海量的关系型数据进行有效挖掘的目的,采用将数据挖掘领域的聚类分析算法与力导引布局算法相结合的方法,提出了一种新的基于聚类分析算法的海量数据可视化方法。针对关系数据集做简单的统计和对比分析,然后通过聚类分析算法对其进行分簇,将得到的各主节点和权重、关系等数据通过力导引算法,写入弹性图布局中,最后基于图可视化的判断标准画出图布局的基本架构。通过ECharts和D3.js作为数据可视化呈现工具,并进行合理的质量评价,在选取10 000个数据情况下准确率达到了89%,证明了所提算法的快速性以及准确性。 展开更多
关键词 数据可视化 聚类分析 关系数据 弹性图布局
在线阅读 下载PDF
基于正负反馈的SEIR微博舆情传播模型 被引量:7
14
作者 邱秀连 田小虎 廖闻剑 《计算机与现代化》 2018年第2期44-48,共5页
社交网络舆情已经成为社会舆情的主要阵地。针对传统模型难以描述社交网络舆情话题的真实传播过程,分析社交网络舆情话题的真实特点,补充加入社交网络中显著的水军和僵尸粉这2大显著特征,作为舆情话题传播中的正负反馈,分别对舆情话题... 社交网络舆情已经成为社会舆情的主要阵地。针对传统模型难以描述社交网络舆情话题的真实传播过程,分析社交网络舆情话题的真实特点,补充加入社交网络中显著的水军和僵尸粉这2大显著特征,作为舆情话题传播中的正负反馈,分别对舆情话题的传播起到推动及抑制作用,构建带有正负反馈的社交网络舆情传播话题模型,提高舆情预测模型的准确率,得出正负反馈对舆情传播的影响力。 展开更多
关键词 社交网络 舆情话题 网络水军 僵尸粉 传播模型 传染病动力学
在线阅读 下载PDF
人物关系的可视化研究 被引量:3
15
作者 邱秀连 康倩 王峥 《计算机系统应用》 2018年第4期27-33,共7页
大数据背景下,数据对于关系的呈现并不直观,因此人物关系的可视化研究对于抽取隐含知识具有重要的实用价值.从人物关系可视化的边-节点关系及相关信息展示的可视化需求出发,改进了D3.js类库,优化边-节点间的指向关系,便于数据处理,尤其... 大数据背景下,数据对于关系的呈现并不直观,因此人物关系的可视化研究对于抽取隐含知识具有重要的实用价值.从人物关系可视化的边-节点关系及相关信息展示的可视化需求出发,改进了D3.js类库,优化边-节点间的指向关系,便于数据处理,尤其是动态数据处理;采用改进的最短路径算法,能够求解无向图的经指定节点的全部最小环,应用于求取关系图中的人员团体关系;利用D3.js可视化类库的数据驱动特性,实现了具有一定数据交互功能的人物关系图可视化原型. 展开更多
关键词 D3.js 可视化 动态交互 最短路径 最小环 关系图
在线阅读 下载PDF
基于自编码器的语音情感识别方法研究 被引量:5
16
作者 钟昕孜 廖闻剑 《电子设计工程》 2020年第6期69-73,共5页
在语音情感识别的研究中存在特征集维度过高的问题。高维度的特征向量易造成参数过拟合。因此需要一种合适的特征提取与筛选的方法降低特征维度。自编码器是一种应用广泛的特征降维方法,由此本文提出一种基于栈式自编码器,结合对抗训练... 在语音情感识别的研究中存在特征集维度过高的问题。高维度的特征向量易造成参数过拟合。因此需要一种合适的特征提取与筛选的方法降低特征维度。自编码器是一种应用广泛的特征降维方法,由此本文提出一种基于栈式自编码器,结合对抗训练的方法并在对抗训练中引入Wasserstein距离构造对抗损失函数进行特征降维。实验结果表明,与原始的对抗自编码器相比,经过改进的自编码器在对特征进行同等程度的降维后,准确率平均提高了3.31%。 展开更多
关键词 语音情感识别 Wasserstein距离 栈式自编码器 对抗自编码器
在线阅读 下载PDF
基于ALS模型协同过滤推荐算法的优化 被引量:4
17
作者 倪满满 《计算机与现代化》 2018年第2期76-79,共4页
推荐系统可以根据用户的基本信息与行为分析用户的兴趣,向用户提供个性化推荐服务,因而成了近年来的研究热点。本文研究基于ALS模型协同过滤推荐算法。算法采用分布式平台实现,对比以往单节点实现,实验结果表明该算法在计算速度上有了... 推荐系统可以根据用户的基本信息与行为分析用户的兴趣,向用户提供个性化推荐服务,因而成了近年来的研究热点。本文研究基于ALS模型协同过滤推荐算法。算法采用分布式平台实现,对比以往单节点实现,实验结果表明该算法在计算速度上有了很大的提升。本文通过在损失函数上融合物品的相似性来减少隐形因子物品属性信息的丢失,同时在最优模型得出的预测评分中引入兴趣遗忘函数,通过实验对比结果表明,本文的优化算法有效提高了推荐系统的准确性。 展开更多
关键词 SPARK 推荐算法 ALS模型 隐性因子 遗忘函数
在线阅读 下载PDF
基于Fast-Flux的DNS异常行为分析 被引量:1
18
作者 李骜骋 王峥 《计算机工程》 CAS CSCD 北大核心 2018年第12期184-189,195,共7页
研究基于Fast-Flux域名系统(DNS)报文的异常行为,并分析僵尸网络的工作特点,依据大量DNS报文的数据,了解Fast-Flux的攻击特性,找到Fast-Flux攻击的具体特征,识别出DNS流量中的异常数据。通过对DNS数据的综合分析,区分Fast-Flux和频繁更... 研究基于Fast-Flux域名系统(DNS)报文的异常行为,并分析僵尸网络的工作特点,依据大量DNS报文的数据,了解Fast-Flux的攻击特性,找到Fast-Flux攻击的具体特征,识别出DNS流量中的异常数据。通过对DNS数据的综合分析,区分Fast-Flux和频繁更换IP的大型网站,给出Fast-Flux报文存活时间较短、时间差分布平均、请求频繁、IP池等特征,并提出一种报文筛选的算法。分析结果证明,与传统僵尸网络检测方法相比,在报文正确率相同的情况下,该算法实现更加简单,可以准确形容Fast-Flux的攻击行为。 展开更多
关键词 Fast-Flux攻击 僵尸网络 域名系统 负载躲避 载流均衡
在线阅读 下载PDF
基于多视图Tri-Training的微博用户性别判断 被引量:2
19
作者 孙启蕴 《计算机系统应用》 2018年第2期240-244,共5页
互联网技术不断发展,新浪微博作为公开的网络社交平台拥有庞大的活跃用户.然而由于用户数量庞大,且个人信息并不一定真实,造成训练样本打标困难.本文采用了一种多视图tri-training的方法,构建三个不同的视图,利用这些视图中少量已打标... 互联网技术不断发展,新浪微博作为公开的网络社交平台拥有庞大的活跃用户.然而由于用户数量庞大,且个人信息并不一定真实,造成训练样本打标困难.本文采用了一种多视图tri-training的方法,构建三个不同的视图,利用这些视图中少量已打标样本和未打标样本不断重复互相训练三个不同的分类器,最后集成这三个分类器实现用户性别判断.本文用真实用户数据进行实验,发现和单一视图分类器相比,使用多视图tri-training学习训练后的分类器准确性更好,且需要打标的样本更少. 展开更多
关键词 性别判断 多视图学习 tri-training算法 数据挖掘
在线阅读 下载PDF
基于布隆过滤器的海量数据查询技术的优化与应用 被引量:3
20
作者 饶文 陈旭 《微型电脑应用》 2018年第2期68-71,80,共5页
通过一个用户行为数据分析的案例,说明了布隆过滤器的原理和应用场景。在案例中,需要使用MapReduce框架在海量数据中筛选出付费用户相关的数据,布隆过滤器算法提供了一种快速、有效的实现方法。简述了使用MongoDB内存数据库存储付费用... 通过一个用户行为数据分析的案例,说明了布隆过滤器的原理和应用场景。在案例中,需要使用MapReduce框架在海量数据中筛选出付费用户相关的数据,布隆过滤器算法提供了一种快速、有效的实现方法。简述了使用MongoDB内存数据库存储付费用户的解决方案,其搜索效率高,但随着数据量的增加,一对多并发查询给服务端带来的压力会越来越大;如果使用分布式缓存的方法,这时为一对一存取,带来的问题是占用内存增大,如果数据结构选择HashSet,存入量大时,则容易使堆内存溢出,故考虑使用自定义数据结构:布隆过滤器,对其原理和误判率进行了分析,并针对其可能产生的错误数据("假阳性")提出消除方案,经实验验证,布隆过滤器占用内存低、查找效率高,解决本类问题极为合适。 展开更多
关键词 MAPREDUCE 布隆过滤器 数据集 MONGODB
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部