期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
无模型强化学习研究综述 被引量:31
1
作者 秦智慧 李宁 +3 位作者 刘晓彤 刘秀磊 佟强 刘旭红 《计算机科学》 CSCD 北大核心 2021年第3期180-187,共8页
强化学习(Reinforcement Learning,RL)作为机器学习领域中与监督学习、无监督学习并列的第三种学习范式,通过与环境进行交互来学习,最终将累积收益最大化。常用的强化学习算法分为模型化强化学习(Model-based Reinforcement Lear-ning)... 强化学习(Reinforcement Learning,RL)作为机器学习领域中与监督学习、无监督学习并列的第三种学习范式,通过与环境进行交互来学习,最终将累积收益最大化。常用的强化学习算法分为模型化强化学习(Model-based Reinforcement Lear-ning)和无模型强化学习(Model-free Reinforcement Learning)。模型化强化学习需要根据真实环境的状态转移数据来预定义环境动态模型,随后在通过环境动态模型进行策略学习的过程中无须再与环境进行交互。在无模型强化学习中,智能体通过与环境进行实时交互来学习最优策略,该方法在实际任务中具有更好的通用性,因此应用范围更广。文中对无模型强化学习的最新研究进展与发展动态进行了综述。首先介绍了强化学习、模型化强化学习和无模型强化学习的基础理论;然后基于价值函数和策略函数归纳总结了无模型强化学习的经典算法及各自的优缺点;最后概述了无模型强化学习在游戏AI、化学材料设计、自然语言处理和机器人控制领域的最新研究现状,并对无模型强化学习的未来发展趋势进行了展望。 展开更多
关键词 人工智能 强化学习 深度强化学习 无模型强化学习 马尔可夫决策过程
在线阅读 下载PDF
多维数值型敏感属性数据的个性化隐私保护方法 被引量:19
2
作者 张梅舒 徐雅斌 《计算机应用》 CSCD 北大核心 2020年第2期491-496,共6页
为了解决多维数值型敏感属性数据隐私保护方法中存在的准标识符属性信息损失大,以及不能满足用户对数值型敏感属性重要性排序的个性化需求问题,提出一种基于聚类和加权多维桶分组(MSB)的个性化隐私保护方法。首先,根据准标识符的相似程... 为了解决多维数值型敏感属性数据隐私保护方法中存在的准标识符属性信息损失大,以及不能满足用户对数值型敏感属性重要性排序的个性化需求问题,提出一种基于聚类和加权多维桶分组(MSB)的个性化隐私保护方法。首先,根据准标识符的相似程度,将数据集划分成若干准标识符属性值相近的子集;然后,考虑到用户对敏感属性的敏感程度不同,将敏感程度和多维桶的桶容量用于计算加权选择度和构建加权多维桶;最后,依此对数据进行分组和匿名化处理。选用UCI的标准Adult数据集中的8个属性进行实验,并与基于聚类和多维桶的数据隐私保护方法MNSACM和基于聚类和加权多维桶分组的个性化隐私保护方法WMNSAPM进行对比。实验结果表明,所提方法整体较优,并且在减少信息损失和运行时间方面明显优于对比方法,提高了数据质量和运行效率。 展开更多
关键词 隐私保护 多维数值型敏感属性 聚类 匿名化 个性化
在线阅读 下载PDF
分类任务中标签噪声的研究综述 被引量:3
3
作者 佟强 刁恩虎 +3 位作者 李丹 谌彤童 刘旭红 刘秀磊 《科学技术与工程》 北大核心 2022年第31期13626-13635,共10页
近年来,随着机器学习的发展,分类系统的性能有了很大的飞跃。模型需要大量带标签数据才能使训练结果达到要求,而获取高质量的标注数据费时费力。为了降低成本,出现了众包、自动化系统等方法标注训练数据。但是,这些标注方法往往会产生... 近年来,随着机器学习的发展,分类系统的性能有了很大的飞跃。模型需要大量带标签数据才能使训练结果达到要求,而获取高质量的标注数据费时费力。为了降低成本,出现了众包、自动化系统等方法标注训练数据。但是,这些标注方法往往会产生大量错误标注,即标签噪声。另外,信息不足、专家错误和编码错误等因素,也可能使标签受到污染。训练过程中对标签噪声的处理不当,可能会使预测精度和准确性降低,或者使模型复杂度增加。因此,研究标签噪声对推广机器学习在各领域的应用和降低机器学习算法的部署成本等方面具有重要意义。通过综述产生标签噪声的原因、影响以及近几年来应对标签噪声的一些技术方法,对标签噪声的研究现状和发展前景进行分析。 展开更多
关键词 机器学习 分类系统 数据标注 模型复杂度 标签噪声
在线阅读 下载PDF
边云协同计算中成本感知的物联网数据处理方法 被引量:7
4
作者 王晨华 侯守璐 刘秀磊 《计算机科学》 CSCD 北大核心 2022年第S02期820-826,共7页
随着物联网终端设备联网产生大量计算密集型的任务,文中提出了一种针对边云协同计算中成本优化的大数据处理方法。首先,所提算法考虑网络传输带宽约束及计算资源约束,联合优化带宽资源、计算资源分配以及动态卸载策略。其次,应用MapRed... 随着物联网终端设备联网产生大量计算密集型的任务,文中提出了一种针对边云协同计算中成本优化的大数据处理方法。首先,所提算法考虑网络传输带宽约束及计算资源约束,联合优化带宽资源、计算资源分配以及动态卸载策略。其次,应用MapReduce框架,建立边云协同计算模型,通过Lyapunov优化理论将目标公式拆分成4个子问题,分别进行优化求解。大量对比实验结果表明,通过合理利用边缘和云的力量,在保证系统稳定性的前提下,所提算法可以有效地提高云计算的数据处理效率,降低服务供应商的数据处理开销,同时,该算法可降低任务成本总开销及提高性价比(队列长度与运营成本的比值),在物联网数据处理过程中,应用边云协同计算方法对降低成本开销并提高性价比具有重要意义。 展开更多
关键词 物联网 边云协同 任务卸载 运营成本 Lyapunov优化理论
在线阅读 下载PDF
基于注意力机制和生成对抗网络的飞行器短期航迹预测模型 被引量:6
5
作者 陈玉立 佟强 +2 位作者 谌彤童 侯守璐 刘秀磊 《计算机应用》 CSCD 北大核心 2022年第10期3292-3299,共8页
针对单一长短时记忆(LSTM)网络在航迹预测上无法有效提取关键信息以及难以精准拟合数据分布等问题,提出基于注意力机制和生成对抗网络(GAN)的飞行器短期轨迹预测模型。首先,引入注意力机制对航迹赋予不同的权重,以提升航迹中重要特征的... 针对单一长短时记忆(LSTM)网络在航迹预测上无法有效提取关键信息以及难以精准拟合数据分布等问题,提出基于注意力机制和生成对抗网络(GAN)的飞行器短期轨迹预测模型。首先,引入注意力机制对航迹赋予不同的权重,以提升航迹中重要特征的影响力;其次,基于LSTM提取航迹序列特征,并经汇聚层汇集时间步长内所有的飞行器特征;最后,利用GAN在对抗博弈下不断优化的特性来优化模型,从而提高模型的准确性。相较于社会生成对抗网络(SGAN),所提模型在处于爬升阶段的数据集上的平均位移误差(ADE)、最终位移误差(FDE)及最大位移误差(MDE)分别降低了20.0%、20.4%和18.3%。实验结果表明,所提模型能更精确地预测未来航迹。 展开更多
关键词 航迹预测 注意力机制 生成对抗网络 长短时记忆网络
在线阅读 下载PDF
基于边界框标注的弱监督显著性目标检测算法 被引量:3
6
作者 王强 黄小明 +1 位作者 佟强 刘秀磊 《计算机应用》 CSCD 北大核心 2023年第6期1910-1918,共9页
针对以往的弱监督显著性目标检测算法存在的显著目标定位不准确问题,提出一种基于边界框标注的弱监督显著目标检测算法。所提算法利用图像中所有目标的最小外接矩形框,即边界框,作为监督信息。首先基于边界框标注和GrabCut算法生成初始... 针对以往的弱监督显著性目标检测算法存在的显著目标定位不准确问题,提出一种基于边界框标注的弱监督显著目标检测算法。所提算法利用图像中所有目标的最小外接矩形框,即边界框,作为监督信息。首先基于边界框标注和GrabCut算法生成初始显著图;然后在此基础上设计了一个缺失修正模块,以得到优化后的显著图;最后结合传统方法和深度学习方法各自的优势,将优化后的显著图作为伪真值,通过神经网络学习一个显著性目标检测模型。在4个公开数据集上与6种无监督、4种弱监督的显著性检测算法进行比较的实验结果显示,所提算法在所有数据集上的最大F度量值(Max-F)和平均绝对误差(MAE)均明显优于对比算法:与同样基于边界框标注的弱监督方法SBB(Saliency Bounding Boxes)相比,所提算法的标注方法更简单,在ECSSD、DUTS-TE、HKU-IS、DUT-OMRON等4个数据集上进行实验,Max-F分别提高了1.82%、4.00%、1.27%和5.33%,MAE分别降低了13.89%、15.07%、8.77%和13.33%。可见,所提算法是一种具有良好检测性能的弱监督显著目标检测算法。 展开更多
关键词 弱监督 边界框标注 显著图 伪真值 显著性目标检测
在线阅读 下载PDF
基于DCNN和GLU的武器领域实体关系抽取方法 被引量:2
7
作者 李晗 侯守璐 +3 位作者 佟强 谌彤童 杨启民 刘秀磊 《计算机科学》 CSCD 北大核心 2023年第S01期48-54,共7页
武器领域的非结构化文本数据通常十分复杂,单句内可能存在“一武器与多个武器相关联”或“两武器之间存在多种关系”等情况,为此提出基于膨胀卷积神经网络和门控线性单元的实体关系抽取方法以处理该类型数据中存在的关系重叠问题。该方... 武器领域的非结构化文本数据通常十分复杂,单句内可能存在“一武器与多个武器相关联”或“两武器之间存在多种关系”等情况,为此提出基于膨胀卷积神经网络和门控线性单元的实体关系抽取方法以处理该类型数据中存在的关系重叠问题。该方法将拼接了词向量和位置向量的句子编码向量传入带有门控机制的膨胀卷积神经网络模型,引入可以快速抽取句内命名实体特征信息的自注意力机制,通过分层次的序列标注方式识别出句中全部实体以及每个主实体对应的所有关系和客实体,进而生成武器领域实体关系三元组。实验结果显示,该方法在自行标注的武器领域数据集上的F1值达81.1%,具备一定的实体关系抽取能力,在不同重叠类型下的F1值均高于78%,能够解决非结构化数据的关系重叠问题,同时在公开数据集NYT上也有良好的表现。 展开更多
关键词 关系抽取 关系重叠 膨胀卷积神经网络 门控线性单元
在线阅读 下载PDF
数据挖掘在乙二醇反应中的应用研究
8
作者 秦智慧 佟强 +2 位作者 李宁 谭胖 刘秀磊 《广东化工》 CAS 2022年第15期1-5,共5页
我国煤制乙二醇技术近年来发展迅速。乙二醇总产能加速突破,其在聚酯、防冻液、炸药等工业领域应用广泛。乙二醇作为基本化工原料,其下游反应网络复杂,下游产品的多元化发展引起了研究人员广泛关注。通过利用高通量数据挖掘技术探索乙... 我国煤制乙二醇技术近年来发展迅速。乙二醇总产能加速突破,其在聚酯、防冻液、炸药等工业领域应用广泛。乙二醇作为基本化工原料,其下游反应网络复杂,下游产品的多元化发展引起了研究人员广泛关注。通过利用高通量数据挖掘技术探索乙二醇相关化学反应,分析QM9数据集中的组分数据,成功构建出91766个乙二醇作为反应物的化学反应和4个乙二醇作为产物的化学反应。随后基于知识图谱思想构建了乙二醇反应计算平台,利用化学反应网络增强分子之间的关联,丰富下游产品的结构。全部反应数据及代码均已开源,期望可以为乙二醇下游产品多元化研究提供便利,为乙二醇下游产业发展提供参考。 展开更多
关键词 乙二醇 煤化工 高通量 数据挖掘 反应网络 知识图谱
在线阅读 下载PDF
机器学习结合分子SMILES特征预测油品碳正离子生成焓性质
9
作者 詹志文 杨涛 +2 位作者 刘旭红 周余伟 周利平 《燃料化学学报(中英文)》 2025年第4期613-624,共12页
碳正离子是油品加工等多种化学反应中的关键中间体,其热力学生成焓性质在计算反应焓变、反应能垒、反应速率常数和理解反应机理等方面至关重要。实验上制备和获取碳正离子非常困难,无法直接测量其生成焓性质。目前,主流的做法是通过基... 碳正离子是油品加工等多种化学反应中的关键中间体,其热力学生成焓性质在计算反应焓变、反应能垒、反应速率常数和理解反应机理等方面至关重要。实验上制备和获取碳正离子非常困难,无法直接测量其生成焓性质。目前,主流的做法是通过基团加和法估算,或者通过高精度量子化学方法计算。前者是经验性估算方法,计算快速但误差较大,后者通常基于第一性原理方法,计算精准但计算量巨大。本研究提出一种利用机器学习结合分子SMILES特征进行碳正离子生成焓预测的新方法,实现了以较低计算成本快速准确地预测油品碳正离子的生成焓性质。构建了156个油品烃类碳正离子数据集,利用SMILES特征提取体系信息,考察并利用多个机器学习方法进行模型的训练和构建,获得一个基于支持向量机回归的预测模型,其在训练集和测试集上的决定系数R^(2)达到了0.957和0.966,同时预测的平均绝对误差MAE为2.21 kcal/mol。机器学习结合SMILES特征不仅为油品碳正离子的生成焓预测提供了一种高效实用的策略,还为相关反应过程的热力学和动力学研究开辟了新途径。 展开更多
关键词 碳正离子 生成焓 机器学习 SMILES特征
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部