期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
蓄热式热氧化器控制系统设计与实现
1
作者 冯涣婷 祝强 +1 位作者 何宇 陆敏智 《机电工程技术》 2025年第1期113-117,共5页
为了提高蓄热式热氧化器(Regenerative Thermal Oxidizer,RTO)在PVC手套制造业废气治理中的净化效率,根据该行业产生的废气特点,设计了一种三室RTO工艺流程,并开发了与之配套的基于PLC的自动化控制系统。首先,根据RTO工艺流程和监控需求... 为了提高蓄热式热氧化器(Regenerative Thermal Oxidizer,RTO)在PVC手套制造业废气治理中的净化效率,根据该行业产生的废气特点,设计了一种三室RTO工艺流程,并开发了与之配套的基于PLC的自动化控制系统。首先,根据RTO工艺流程和监控需求,构建了硬件控制系统。然后,从提升阀自动换向、废气风量调频控制和PID温度调节控制等功能方面设计了软件系统,确保了RTO的高效自动化运行。进一步地,通过TCP/IP协议,构建了PLC、触摸屏和工业网关之间的以太网连接,并设计了直观易操作的触摸屏监控界面,实现了RTO系统的本地监控和基于云服务器的远程在线监控功能。最后,利用实际生产应用中的温度和频率数据对RTO系统的安全可靠性进行验证,实测数据表明,该控制系统不仅运行稳定且可靠,而且显著提高了废气的净化效率,净化效率高达99.3%。 展开更多
关键词 控制系统 蓄热式热氧化器 PLC 温度控制 废气治理
在线阅读 下载PDF
一类基于谱方法的强化学习混合迁移算法 被引量:10
2
作者 朱美强 程玉虎 +2 位作者 李明 王雪松 冯涣婷 《自动化学报》 EI CSCD 北大核心 2012年第11期1765-1776,共12页
在状态空间比例放大的迁移任务中,原型值函数方法只能有效迁移较小特征值对应的基函数,用于目标任务的值函数逼近时会使部分状态的值函数出现错误.针对该问题,利用拉普拉斯特征映射能保持状态空间局部拓扑结构不变的特点,对基于谱图理... 在状态空间比例放大的迁移任务中,原型值函数方法只能有效迁移较小特征值对应的基函数,用于目标任务的值函数逼近时会使部分状态的值函数出现错误.针对该问题,利用拉普拉斯特征映射能保持状态空间局部拓扑结构不变的特点,对基于谱图理论的层次分解技术进行了改进,提出一种基函数与子任务最优策略相结合的混合迁移方法.首先,在源任务中利用谱方法求取基函数,再采用线性插值技术将其扩展为目标任务的基函数;然后,用插值得到的次级基函数(目标任务的近似Fiedler特征向量)实现任务分解,并借助改进的层次分解技术求取相关子任务的最优策略;最后,将扩展的基函数和获取的子任务策略一起用于目标任务学习中.所提的混合迁移方法可直接确定目标任务部分状态空间的最优策略,减少了值函数逼近所需的最少基函数数目,降低了策略迭代次数,适用于状态空间比例放大且具有层次结构的迁移任务.格子世界的仿真结果验证了新方法的有效性. 展开更多
关键词 强化学习 迁移学习 谱图理论 原型值函数 层次分解
在线阅读 下载PDF
基于状态-动作图测地高斯基的策略迭代强化学习 被引量:6
3
作者 程玉虎 冯涣婷 王雪松 《自动化学报》 EI CSCD 北大核心 2011年第1期44-51,共8页
在策略迭代强化学习中,基函数构造是影响动作值函数逼近精度的一个重要因素.为了给动作值函数逼近提供合适的基函数,提出一种基于状态-动作图测地高斯基的策略迭代强化学习方法.首先,根据离策略方法建立马尔可夫决策过程的状态-动作图... 在策略迭代强化学习中,基函数构造是影响动作值函数逼近精度的一个重要因素.为了给动作值函数逼近提供合适的基函数,提出一种基于状态-动作图测地高斯基的策略迭代强化学习方法.首先,根据离策略方法建立马尔可夫决策过程的状态-动作图论描述;然后,在状态-动作图上定义测地高斯核函数,利用基于近似线性相关的核稀疏方法自动选择测地高斯核的中心;最后,在策略评估阶段利用基于状态-动作图的测地高斯核逼近动作值函数,并基于估计的值函数进行策略改进.10×10格子世界的仿真结果表明,与基于状态图普通高斯基和测地高斯基的策略迭代强化学习方法相比,本文所提方法能以较少的基函数、高精度地逼近具有光滑且不连续特性的动作值函数,从而有效地获得最优策略. 展开更多
关键词 状态-动作图 测地高斯核 基函数 策略迭代 强化学习
在线阅读 下载PDF
基于参数探索的期望最大化策略搜索 被引量:4
4
作者 程玉虎 冯涣婷 王雪松 《自动化学报》 EI CSCD 北大核心 2012年第1期38-45,共8页
针对随机探索易于导致梯度估计方差过大的问题,提出一种基于参数探索的期望最大化(Expectation-maximization,EM)策略搜索方法.首先,将策略定义为控制器参数的一个概率分布.然后,根据定义的概率分布直接在控制器参数空间进行多次采样以... 针对随机探索易于导致梯度估计方差过大的问题,提出一种基于参数探索的期望最大化(Expectation-maximization,EM)策略搜索方法.首先,将策略定义为控制器参数的一个概率分布.然后,根据定义的概率分布直接在控制器参数空间进行多次采样以收集样本.在每一幕样本的收集过程中,由于选择的动作均是确定的,因此可以减小采样带来的方差,从而减小梯度估计方差.最后,基于收集到的样本,通过最大化期望回报函数的下界来迭代地更新策略参数.为减少采样耗时和降低采样成本,此处利用重要采样技术以重复使用策略更新过程中收集的样本.两个连续空间控制问题的仿真结果表明,与基于动作随机探索的策略搜索强化学习方法相比,本文所提方法不仅学到的策略最优,而且加快了算法收敛速度,具有较好的学习性能. 展开更多
关键词 策略搜索 强化学习 参数空间 探索 期望最大化 重要采样
在线阅读 下载PDF
基于不确定性估计的离线确定型Actor-Critic
5
作者 冯涣婷 程玉虎 王雪松 《计算机学报》 EI CAS CSCD 北大核心 2024年第4期717-732,共16页
Actor-Critic是一种强化学习方法,通过与环境在线试错交互收集样本来学习策略,是求解序贯感知决策问题的有效手段.但是,这种在线交互的主动学习范式在一些复杂真实环境中收集样本时会带来成本和安全问题离线强化学习作为一种基于数据驱... Actor-Critic是一种强化学习方法,通过与环境在线试错交互收集样本来学习策略,是求解序贯感知决策问题的有效手段.但是,这种在线交互的主动学习范式在一些复杂真实环境中收集样本时会带来成本和安全问题离线强化学习作为一种基于数据驱动的强化学习范式,强调从静态样本数据集中学习策略,与环境无探索交互,为机器人、自动驾驶、健康护理等真实世界部署应用提供了可行的解决方案,是近年来的研究热点.目前,离线强化学习方法存在学习策略和行为策略之间的分布偏移挑战,针对这个挑战,通常采用策略约束或值函数正则化来限制访问数据集分布之外(Out-Of-Distribution,OOD)的动作,从而导致学习性能过于保守,阻碍了值函数网络的泛化和学习策略的性能提升.为此,本文利用不确定性估计和OOD采样来平衡值函数学习的泛化性和保守性,提出一种基于不确定性估计的离线确定型Actor-Critic方法(Offline Deterministic Actor-Critic based on UncertaintyEstimation,ODACUE).首先,针对确定型策略,给出一种Q值函数的不确定性估计算子定义,理论证明了该算子学到的Q值函数是最优Q值函数的一种悲观估计.然后,将不确定性估计算子应用于确定型Actor-Critic框架中,通过对不确定性估计算子进行凸组合构造Critic学习的目标函数.最后,D4RL基准数据集任务上的实验结果表明:相较于对比算法,ODACUE在11个不同质量等级数据集任务中的总体性能提升最低达9.56%,最高达64.92%.此外,参数分析和消融实验进一步验证了ODACUE的稳定性和泛化能力. 展开更多
关键词 离线强化学习 不确定性估计 分布外采样 凸组合 Actor-Critic
在线阅读 下载PDF
“1+X”背景下工业机器人操作与编程课程的设计与实践 被引量:2
6
作者 冯涣婷 祖层 +1 位作者 喻永康 陆敏智 《中国现代教育装备》 2022年第1期157-160,共4页
在“中国制造2025”和“1+X”证书制度的背景下,针对工业机器人操作与编程课程体系不健全的问题,从课程目标、课程内容和考核评价三方面出发,将“1+X”证书的职业技能目标融入课程中,设计和实践了工业机器人搬运码垛典型案例的教学过程... 在“中国制造2025”和“1+X”证书制度的背景下,针对工业机器人操作与编程课程体系不健全的问题,从课程目标、课程内容和考核评价三方面出发,将“1+X”证书的职业技能目标融入课程中,设计和实践了工业机器人搬运码垛典型案例的教学过程,为工业机器人专业课程建设提供借鉴。 展开更多
关键词 “1+X”证书制度 搬运码垛 工业机器人 教学设计
在线阅读 下载PDF
“工业机器人操作与编程”课程思政实践举措 被引量:1
7
作者 冯涣婷 祖层 喻永康 《科教文汇》 2023年第10期149-152,共4页
推进课程思政建设是高校落实立德树人根本任务的战略举措。以“工业机器人操作与编程”课程为例,制定了课程思政育人目标,从挖掘课程思政元素、改进教学方法和完善教学评价机制等三个方面对课程思政开展具体实践,旨在增强课程思政育人... 推进课程思政建设是高校落实立德树人根本任务的战略举措。以“工业机器人操作与编程”课程为例,制定了课程思政育人目标,从挖掘课程思政元素、改进教学方法和完善教学评价机制等三个方面对课程思政开展具体实践,旨在增强课程思政育人功能。 展开更多
关键词 工业机器人 课程思政 操作与编程 思政元素
在线阅读 下载PDF
“1+X”制度下“工业机器人操作与编程”课程改革
8
作者 冯涣婷 喻永康 +1 位作者 祖层 陆敏智 《科技风》 2021年第22期24-25,共2页
“1+X”证书制度是国家职业教育改革实施方案的主要内容之一,针对江苏信息职业技术学院的工业机器人技术专业的课程改革任务,通过对标“1+X”工业机器人操作与运维证书的职业技能等级标准和《工业机器人操作与编程》课程标准,采用书证... “1+X”证书制度是国家职业教育改革实施方案的主要内容之一,针对江苏信息职业技术学院的工业机器人技术专业的课程改革任务,通过对标“1+X”工业机器人操作与运维证书的职业技能等级标准和《工业机器人操作与编程》课程标准,采用书证融通方式对教学内容和教学评价进行改革探索,以期提高人才培养质量。 展开更多
关键词 “1+X”证书 工业机器人 课程改革 书证融通
在线阅读 下载PDF
基于ZigBee的自动阻燃报警系统
9
作者 丁万 冯涣婷 +1 位作者 胡帅 杨钰林 《电子测试》 2021年第2期15-17,47,共4页
针对移动货车货物车厢内无法及时观察和阻燃内部货物起火的痛点,设计了一种基于ZigBee无线传感网的自动阻燃报警装置,该系统将烟雾传感器、火焰传感器固定在车厢内部,利用ZigBee无线传输技术,将信号发送到中控主板上,通过电信号和电磁... 针对移动货车货物车厢内无法及时观察和阻燃内部货物起火的痛点,设计了一种基于ZigBee无线传感网的自动阻燃报警装置,该系统将烟雾传感器、火焰传感器固定在车厢内部,利用ZigBee无线传输技术,将信号发送到中控主板上,通过电信号和电磁阀等器件控制CO2消防装置进行自动报警灭火,该系统在货物运输过程中能够及时预测和处理火情。 展开更多
关键词 ZIGBEE技术 阻燃 报警系统
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部