期刊文献+
共找到208篇文章
< 1 2 11 >
每页显示 20 50 100
基于时频融合多级注意力机制的双通道CNN轴承故障诊断模型
1
作者 冯新 陈儒晖 杨雄 《贵州大学学报(自然科学版)》 2024年第6期70-77,共8页
为进一步提高轴承故障诊断准确率,提出了一种基于快速傅里叶变换(fast fourier transform,FFT)和变分模态分解(variational mode decomposition,VMD),并融合多级注意力机制的双通道卷积神经网络(convolutional neural networks,CNN)模... 为进一步提高轴承故障诊断准确率,提出了一种基于快速傅里叶变换(fast fourier transform,FFT)和变分模态分解(variational mode decomposition,VMD),并融合多级注意力机制的双通道卷积神经网络(convolutional neural networks,CNN)模型用于滚动轴承故障诊断。首先,将一维故障信号经过FFT和VMD处理后进行堆叠,作为双通道CNN的输入;其次,将预处理后的数据分别通过基于通道注意力和全局注意力的二维CNN提取重要特征;再次,利用交叉注意力机制将两个通道提取的特征进行融合;最后,经过全连接层和softmax分类器进行故障诊断。试验结果表明:采用该方法在美国凯斯西储大学10类轴承故障数据集的平均准确率达到100%,其诊断精度优于常见的故障预测模型和单通道模型,有利于促进轴承的智能故障诊断研究和实际应用。 展开更多
关键词 故障诊断 时频融合 注意力机制 通道卷积神经网络
在线阅读 下载PDF
基于Elmo和注意力机制的双通道文本分类模型
2
作者 陈小莹 艾金勇 《计算机仿真》 2024年第10期507-512,523,共7页
针对中文文本分类过程中文本特征提取不全面、语义表征不准确的问题,提出一种基于改进Elmo模型、带有注意力机制的卷积神经网络与门控循环网络相结合的双通道文本分类模型。模型首先将静态词向量输入Elmo模型生成动态词向量对文本进行表... 针对中文文本分类过程中文本特征提取不全面、语义表征不准确的问题,提出一种基于改进Elmo模型、带有注意力机制的卷积神经网络与门控循环网络相结合的双通道文本分类模型。模型首先将静态词向量输入Elmo模型生成动态词向量对文本进行表示;然后利用双通道结构构建加入注意力机制的卷积神经网络和双向门控循环网络分别提取文本内部特征和全局语义信息;最后,将双通道特征向量融合处理后通过分类器完成文本分类。依托THUCNews数据集进行模型的仿真,所提模型分类准确率和召回率分别为90.21%、90.45%,实验结果表明,与其它分类模型相比,所提模型具有更好的分类性能。 展开更多
关键词 文本分类 特征融合 注意力机制 通道
在线阅读 下载PDF
结合特征融合和通道注意力的多分支换装行人重识别
3
作者 胡涌涛 黄洪琼 《计算机工程》 北大核心 2025年第1期225-234,共10页
换装行人重识别(CC Re-ID)是行人重识别中的一个新兴研究课题,旨在找出被换衣的行人。当前方法主要集中在使用多模态数据辅助解耦表征学习,如通过脸、步态、身体轮廓等辅助数据解耦行人自身属性以减少服装影响,但这些方法泛化能力较差,... 换装行人重识别(CC Re-ID)是行人重识别中的一个新兴研究课题,旨在找出被换衣的行人。当前方法主要集中在使用多模态数据辅助解耦表征学习,如通过脸、步态、身体轮廓等辅助数据解耦行人自身属性以减少服装影响,但这些方法泛化能力较差,需要大量额外工作。此外,仅使用原始数据的方法对于相关信息的提取不够充分,性能较弱。针对CC Re-ID存在的上述问题,提出一种结合特征融合和通道注意力的多分支换装行人重识别方法(MBFC)。通过在主干网络中融入通道注意力机制,在特征通道层面学习关键信息,设计局部与全局特征融合方法以提高网络对行人细粒度特征的提取能力。此外,MBFC模型采用多分支结构,使用服装对抗损失、交叉熵标签平滑损失等多种损失函数引导模型学习与服装无关的信息,减少服装对模型的影响,从而提取到更有效的行人信息。在PRCC和VC-Clothes数据集上进行广泛实验,结果表明,所提模型在RANK-1和平均精度均值(mAP)指标上优于对比的CC Re-ID方法。 展开更多
关键词 换装行人重识别 多分支 通道注意力 特征融合 注意力机制
在线阅读 下载PDF
融合双注意力机制的多尺度胰腺分割方法
4
作者 张国栋 唐晓艺 +1 位作者 鞠蓉晖 宫照煊 《计算机工程与设计》 北大核心 2024年第4期1189-1194,共6页
为解决CT图像中胰腺边界不规则导致分割精度不高的问题,提出一种融合双注意机制的多尺度U型网络模型。该模型由一个编码器及两个解码器组成,提高特征利用。针对模型中连续下采样导致特征空间信息损失的问题,提出一种金字塔注意力特征融... 为解决CT图像中胰腺边界不规则导致分割精度不高的问题,提出一种融合双注意机制的多尺度U型网络模型。该模型由一个编码器及两个解码器组成,提高特征利用。针对模型中连续下采样导致特征空间信息损失的问题,提出一种金字塔注意力特征融合模块,引入通道和空间两个独立注意力机制,提供多尺度输入信息并行采样,提高边界提取性能,提升分割精度。实验结果表明,该方法在ISICDM 2018数据集上的平均Dice系数为85.35%,具有效性。 展开更多
关键词 胰腺分割 注意力机制 解码器 金字塔池化 特征融合 边界提取 多尺度信息
在线阅读 下载PDF
基于双通道多特征融合网络语音情感识别
5
作者 裴晓敏 刘诗琦 《微电子学与计算机》 2025年第1期9-16,共8页
单一语音特征无法充分表达语音情感,而多个声学特征简单拼接的融合方法容易造成情感信息丢失,且采用单个通道特征提取网络无法全面提取语音中的情感特征。针对上述问题,本文提出基于双通道特征融合网络语音情感识别,以梅尔频率倒谱系数... 单一语音特征无法充分表达语音情感,而多个声学特征简单拼接的融合方法容易造成情感信息丢失,且采用单个通道特征提取网络无法全面提取语音中的情感特征。针对上述问题,本文提出基于双通道特征融合网络语音情感识别,以梅尔频率倒谱系数、均方根、过零率和色度短时傅里叶变换这4种对情感种类贡献度较大的语音特征作为输入,采用双通道网络结构分别提取短时局部特征和全局上下文特征;将基于一维空洞卷积的局部特征提取网络和引入自注意力机制的双向长短时记忆全局特征提取网络并行,避免信息相互干扰;利用投票策略的集成学习方法实现各通道深层特征的充分融合,以获得语音中更深层的情感信息和更加精准的分类准确率。实验结果表明:基于双通道多特征融合网络模型在TESS、RAVDESS、SAVEE、CREMA-D数据集和混合数据集实现了99.89%、95.89%、96.61%、97.75%和95.13%的情感识别准确率,与同类型的多个语音情感识别模型相比性能优异,识别准确率高于其他模型。 展开更多
关键词 通道 多特征融合 1D CNN LSTM 注意力机制
在线阅读 下载PDF
基于双通道注意力机制的AE-BIGRU交通流预测模型
6
作者 黄艳国 何烜 杨仁峥 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第5期1774-1782,共9页
交通流预测是智能交通系统的关键。针对目前交通流数据复杂的时空关联性以及自身的不确定性,为准确预测高速公路交通流并缓解交通拥堵问题,提出以自编码器网络(AE)和双向门控循环单元(BIGRU)相结合的深度学习组合预测模型(AE-BIGRU),并... 交通流预测是智能交通系统的关键。针对目前交通流数据复杂的时空关联性以及自身的不确定性,为准确预测高速公路交通流并缓解交通拥堵问题,提出以自编码器网络(AE)和双向门控循环单元(BIGRU)相结合的深度学习组合预测模型(AE-BIGRU),并在此基础上引入双通道注意力机制进行模型训练。将预处理后的数据采用滑动窗口的方式作为参数输入模型,通过AE提取交通流的空间特征,得到输入信息特征的最优抽象表示;利用BIGRU从前向和后向传播中获取信息,充分提取交通流的时间相关特征,更全面地捕捉时间演变规律;最后结合双通道注意力机制,增强预测模型的特征提取能力,最大限度地保留特征信息,提升模型的预测精度,从而得到最终短时流量的预测目标值。为验证模型的适用性,采用多组短时交通流数据进行仿真实验,与其他基准模型对比发现:该交通流预测模型能够有效捕获交通流的动态时空特征,加强关键信息的提取,所预测的流量更加接近真实值,具有良好的泛化能力。其中测试集的均方根误差值下降了约0.061~0.604,平均绝对误差值下降了约0.025~0.512,相关系数值R2提高了约0.007~0.062。研究结果表明,随着预测步长的增加,该实验模型在交通流数据的时间特性上仍能表现出稳定的预测性能,所建的组合预测模型在预测精度和鲁棒性方面表现出更高水平。 展开更多
关键词 智能交通 交通流预测 AE-BIGRU模型 深度学习 通道注意力机制
在线阅读 下载PDF
融入注意力机制的双通道神经网络命名实体识别
7
作者 陶露 《兰州工业学院学报》 2024年第4期54-59,共6页
针对深度学习方法识别命名实体缺乏丰富语义信息及冗余信息对命名实体识别的影响问题,提出一种融入注意力机制的双通道神经网络命名实体识别模型(BW-ATT-NERM)。首先使用Word2vec和BERT两种语言模型将文本转换成相应的向量表示形式作为... 针对深度学习方法识别命名实体缺乏丰富语义信息及冗余信息对命名实体识别的影响问题,提出一种融入注意力机制的双通道神经网络命名实体识别模型(BW-ATT-NERM)。首先使用Word2vec和BERT两种语言模型将文本转换成相应的向量表示形式作为模型输入;然后采用BiGRU网络提取文本特征向量,文本特征向量利用注意力机制生成特征向量的加权语义表示;最后利用CRF训练和学习文本特征向量与输出标签之间的关系,预测和输出最佳标签序列。实验结果表明:BW-ATT-NERM模型平均准确率、平均召回率、平均F1值达到95.97%,94.26%,95.11%,与基准识别模型(LSTM-CRF)相比,识别效果更加明显。 展开更多
关键词 命名实体识别 通道 向GRU 注意力机制
在线阅读 下载PDF
双分支GAN与注意力机制的火灾隐患检测算法 被引量:1
8
作者 李牧 何金诚 杨恒 《计算机工程与应用》 CSCD 北大核心 2024年第14期228-239,共12页
针对传统火灾报警在夜间等极端天气下效果不佳,受限于复杂环境等问题,提出一种基于红外与可见光图像融合的火灾预警算法。在生成对抗网络(GAN)中设计并提出双分支注意力结构。其中一条分支通过密集残差子网提取更多鲁棒的特征信息,另一... 针对传统火灾报警在夜间等极端天气下效果不佳,受限于复杂环境等问题,提出一种基于红外与可见光图像融合的火灾预警算法。在生成对抗网络(GAN)中设计并提出双分支注意力结构。其中一条分支通过密集残差子网提取更多鲁棒的特征信息,另一条分支通过注意力子网(efficient coordinate channel attention group,ECCAG)弥补空间信息的缺失,以最大限度获取更多高频细节特征,设计并提出了一种调节损失作为损失函数,通过改进GAN算法得到融合图像,根据提出的火灾预警算法判断是否存在火灾隐患。实验结果表明:改进GAN算法得到的融合数据集目标检测的平均准确率为96.19%,相较于单一红外数据集与原始GAN算法数据集的目标检测平均准确率分别提高了11.09个百分点与6.2个百分点,在公开数据集TNO与LLVIP数据集上测试火灾患检测准确率为97.45%。结果表明,火灾预警算法可以在未发生火灾时及时预警,针对不同场景都可得到显著的检测效果。 展开更多
关键词 生成对抗网络 图像融合 早期火灾预警 分支结构 注意力机制
在线阅读 下载PDF
基于双注意力机制的MSCN-BiGRU的滚动轴承故障诊断方法 被引量:3
9
作者 王敏 邓艾东 +2 位作者 马天霆 张宇剑 薛原 《振动与冲击》 EI CSCD 北大核心 2024年第6期84-92,103,共10页
针对滚动轴承故障诊断模型在变工况和环境噪声干扰下诊断精度降低的问题,提出一种基于双注意力机制的多尺度卷积网络(dual attention and multi-scale convolutional networks,DAMSCN)与改进的双向门控循环单元(bidirectional gated rec... 针对滚动轴承故障诊断模型在变工况和环境噪声干扰下诊断精度降低的问题,提出一种基于双注意力机制的多尺度卷积网络(dual attention and multi-scale convolutional networks,DAMSCN)与改进的双向门控循环单元(bidirectional gated recurrent unit,BiGRU)组成的故障诊断模型DAMSCN-BiGRU。首先,多尺度特征融合模块使用不同大小的卷积核,获得多种感受野,从而提取到轴承原始振动信号的多尺度特征信息,并根据重要性对其进行自适应融合,然后利用通道注意力和空间注意力组成的双注意力模块(dual attention module,DAM)对多尺度特征进行重新标定,分配注意力权重,削弱融合特征中的冗余特征;然后,增加注意力层和利用分段激活改进BiGRU进而挖掘信号的时域特征,以提高轴承故障诊断的性能;最后,通过Softmax层完成对不同故障的分类。试验结果表明,与其他智能诊断模型相比,DAMSCN-BiGRU在变工况环境下,平均诊断精度达到98.2%,在强噪声背景下仍然有着85.3%的准确率,且在不同程度的噪声强度下效果均优于其他常用模型,有利于促进滚动轴承的智能故障诊断研究和实际应用。 展开更多
关键词 滚动轴承 故障诊断 多尺度特征融合 注意力机制 向门控循环单元(BiGRU)
在线阅读 下载PDF
融合双分支特征和注意力机制的葡萄病虫害识别模型 被引量:15
10
作者 彭红星 徐慧明 刘华鼐 《农业工程学报》 EI CAS CSCD 北大核心 2022年第10期156-165,共10页
葡萄病虫害识别是精细化防治的前提。针对现有研究中存在的数据集少、识别精度低、模型参数量大等问题,该研究构建包含健康叶片、3类病害叶片和16类虫害的葡萄病虫害数据集,提出基于改进MobileNet V2模型的葡萄病虫害识别模型。首先在Mo... 葡萄病虫害识别是精细化防治的前提。针对现有研究中存在的数据集少、识别精度低、模型参数量大等问题,该研究构建包含健康叶片、3类病害叶片和16类虫害的葡萄病虫害数据集,提出基于改进MobileNet V2模型的葡萄病虫害识别模型。首先在MobileNet V2模型的反向残差模块中嵌入坐标注意力(Coordinate Attention,CA)机制,提升模型的信息表征能力;然后使用深度可分离卷积设计双分支特征融合模块,加强模型的特征提取能力;最后对模型的通道数进行调整,精简模型结构。试验结果表明:MobileNet_Vitis在葡萄病虫害数据集上的识别准确率和F1分数为89.16%和80.44%,相比改进前的MobileNet V2提高了1.83和9.31个百分点,而模型参数大小为7.85 MB,减少了8.5%。与ResNet101、ShuffleNetV2、MobileNetV3和GhostNet相比,MobileNet_Vitis的识别精度和F1分数更高,参数量更小。MobileNet_Vitis对单张葡萄病虫害图像的推理时间为17.53 ms,可以达到快速识别的要求。该研究提出的模型能够较好地识别葡萄病虫害,并且较大幅度地减少模型的参数量。将MobileNet_Vitis模型部署到移动端的小程序上,可为葡萄病虫害的防治提供帮助。 展开更多
关键词 病虫害 图像识别 葡萄 MobileNet V2 分支特征融合 坐标注意力机制
在线阅读 下载PDF
通道分离双注意力机制的目标检测算法 被引量:14
11
作者 赵珊 郑爱玲 +1 位作者 刘子路 高雨 《计算机科学与探索》 CSCD 北大核心 2023年第5期1112-1125,共14页
对于两阶段目标检测算法中模型存在检测精度低、小目标漏检率高等问题,提出通道分离双注意力机制的目标检测算法,通过改进Faster+FPN主干网络来提高小目标的检测精度。首先针对神经网络不能自动学习特征间的重要性问题,在通道分离过程... 对于两阶段目标检测算法中模型存在检测精度低、小目标漏检率高等问题,提出通道分离双注意力机制的目标检测算法,通过改进Faster+FPN主干网络来提高小目标的检测精度。首先针对神经网络不能自动学习特征间的重要性问题,在通道分离过程中提出双注意力机制来构建深度神经网络,另结合分组卷积、空洞卷积等技术减少网络参数。其次针对高分辨率特征经过深度CNN后导致的信息丢失问题,通过添加细节提取模块以及通道注意力特征融合模块来提取更多的细节特征。最后考虑到一般损失函数不可重点评估目标物位置的置信度,结合KL散度进行损失函数优化,通过训练使得预测分布更接近真实分布,有效地解决了神经网络直接用于目标检测存在的问题。采用PASCAL VOC2007、KITTI以及Pedestrian三类数据集对网络进行训练,并将提出的模型与多个目标检测算法进行对比。实验结果表明,该算法能够高效地对图像进行识别,且具有较高的检测精度。 展开更多
关键词 通道分离 注意力机制 特征金字塔网络(FPN) KL散度 目标检测
在线阅读 下载PDF
基于阅读技巧识别和双通道融合机制的机器阅读理解方法
12
作者 彭伟 胡玥 +2 位作者 李运鹏 谢玉强 牛晨旭 《自动化学报》 EI CAS CSCD 北大核心 2024年第5期958-969,共12页
机器阅读理解任务旨在要求系统对给定文章进行理解,然后对给定问题进行回答.先前的工作重点聚焦在问题和文章间的交互信息,忽略了对问题进行更加细粒度的分析(如问题所考察的阅读技巧是什么?).受先前研究的启发,人类对于问题的理解是一... 机器阅读理解任务旨在要求系统对给定文章进行理解,然后对给定问题进行回答.先前的工作重点聚焦在问题和文章间的交互信息,忽略了对问题进行更加细粒度的分析(如问题所考察的阅读技巧是什么?).受先前研究的启发,人类对于问题的理解是一个多维度的过程.首先,人类需要理解问题的上下文信息;然后,针对不同类型问题,识别其需要使用的阅读技巧;最后,通过与文章交互回答出问题答案.针对这些问题,提出一种基于阅读技巧识别和双通道融合的机器阅读理解方法,对问题进行更加细致的分析,从而提高模型回答问题的准确性.阅读技巧识别器通过对比学习的方法,能够显式地捕获阅读技巧的语义信息.双通道融合机制将问题与文章的交互信息和阅读技巧的语义信息进行深层次的融合,从而达到辅助系统理解问题和文章的目的.为了验证该模型的效果,在FairytaleQA数据集上进行实验,实验结果表明,该方法实现了在机器阅读理解任务和阅读技巧识别任务上的最好效果. 展开更多
关键词 机器阅读理解 阅读技巧识别 对比学习 通道融合机制
在线阅读 下载PDF
基于注意力机制和多尺度融合的U-Net改进算法
13
作者 吴淞 蓝鑫 +1 位作者 单靖杨 徐海文 《计算机应用》 CSCD 北大核心 2024年第S2期24-28,共5页
针对原始U-Net在医学图像分割任务中计算冗余和难以划分细小结构等问题,提出一种基于注意力机制和多尺度融合的U-Net改进算法。首先,通过在跳跃路径上引入通道注意力机制,网络关注包含更重要信息的通道,从而减少计算资源开销,并提升计... 针对原始U-Net在医学图像分割任务中计算冗余和难以划分细小结构等问题,提出一种基于注意力机制和多尺度融合的U-Net改进算法。首先,通过在跳跃路径上引入通道注意力机制,网络关注包含更重要信息的通道,从而减少计算资源开销,并提升计算效率;其次,增加特征融合策略为传递给解码器的特征图增加上下文信息,从而实现特征之间的互补和多重利用;最后,使用Dice损失和二元交叉熵损失进行联合优化,以应对细小结构分割时可能出现的损失函数剧烈振荡问题。在Kvasir_seg和DRIVE数据集上进行的实验验证的结果表明,与原始U-Net算法相比,所提改进算法的Dice系数分别提高了1.81和0.82个百分点,灵敏度(SE)分别提高了1.94和3.53个百分点,准确度(Acc)分别提高了1.62和0.04个百分点。可见,所提改进算法能够提升原始U-Net对于细小结构分割的性能。 展开更多
关键词 深度学习 医学图像分割 U-Net 通道注意力机制 多尺度融合
在线阅读 下载PDF
基于注意力机制及多尺度特征融合的图像去雨 被引量:1
14
作者 宋建辉 胡强强 +1 位作者 刘晓阳 赵亚威 《沈阳理工大学学报》 CAS 2024年第6期28-33,共6页
针对去除不同雨纹的同时恢复图像背景细节的问题,提出一种基于注意力机制及多尺度特征融合的图像去雨方法。该网络采用双分支结构,分别用于雨纹去除和背景恢复。雨纹提取模块采用跨空间学习的多尺度注意力机制,通过多尺度上下文信息捕... 针对去除不同雨纹的同时恢复图像背景细节的问题,提出一种基于注意力机制及多尺度特征融合的图像去雨方法。该网络采用双分支结构,分别用于雨纹去除和背景恢复。雨纹提取模块采用跨空间学习的多尺度注意力机制,通过多尺度上下文信息捕捉、均值计算、权重计算和整体信息综合,帮助改善雨纹去除任务中的图像质量,提高去雨效果。背景恢复模块包括多尺度特征提取部分和特征融合部分,采用多个扩张卷积层,每个卷积层具有不同的扩张因子,以扩大感受野,提取多尺度的图像背景特征;使用大核卷积对提取的多尺度特征信息进行融合调整,从而更准确地进行背景恢复。在多个公开数据集上的实验结果表明:所提方法能够有效去除真实雨图像场景中的雨纹,同时可以更好地恢复图像背景的细节信息。 展开更多
关键词 分支去雨 多尺度特征融合 注意力机制 扩张卷积
在线阅读 下载PDF
基于双通道多尺度注意力机制的光伏板裂缝检测方法
15
作者 强浩 叶波 唐文祺 《计算机测量与控制》 2023年第12期84-89,264,共7页
针对目前传统边缘检测方法提取出的图像边缘轮廓模糊、不连续等问题,提出一种基于双通道多尺度注意力机制的光伏板裂缝检测方法,实现对图像低级边缘、边界、目标轮廓的检测;首先构建了双通道主干网络,包含语义分支通道和空间细节分支通... 针对目前传统边缘检测方法提取出的图像边缘轮廓模糊、不连续等问题,提出一种基于双通道多尺度注意力机制的光伏板裂缝检测方法,实现对图像低级边缘、边界、目标轮廓的检测;首先构建了双通道主干网络,包含语义分支通道和空间细节分支通道;其次,基于多尺度原则构建了多尺度及注意力机制模块,对特征图像的高、宽、通道的维度变换,分配特征权重,在捕捉跨通道信息的同时,还能够捕捉方向感知和位置感知的信息;最后将空洞融合模块融合到语义分支通道中,提升网络提取特征信息的能力。实验结果表明,所提出的算法对光伏板图像边缘检测性能有提升,相较HED、RCF与FCN算法,F_(1)值提升了2.83%、0.37%与1.54%,获得了较为清晰的裂缝图像。 展开更多
关键词 裂缝检测 多尺度 注意力机制 通道网络 空洞融合
在线阅读 下载PDF
基于注意力机制的人脸虹膜双特征融合识别
16
作者 杨岗 周奥 张东兴 《计算机工程与设计》 北大核心 2023年第7期2177-2184,共8页
针对单一生物识别方法存在的固有局限性,利用人脸和虹膜双生物模态信息,提出一种基于注意力机制和低秩多模态融合的身份识别模型(attention mechanism and low-rank multimodal fusion,ALMF)。在模型的人脸和虹膜特征提取网络中均嵌入... 针对单一生物识别方法存在的固有局限性,利用人脸和虹膜双生物模态信息,提出一种基于注意力机制和低秩多模态融合的身份识别模型(attention mechanism and low-rank multimodal fusion,ALMF)。在模型的人脸和虹膜特征提取网络中均嵌入改进的混合注意力机制(I_CBAM),增强有用特征的提取。利用模态特定低秩因子完成低秩多模态特征级融合(low-rank multimodal fusion,LMF),解决传统特征拼接方式无法充分实现各模态特征的互补、容易造成冗余信息和维度灾难等问题。使用简单高效的余弦距离完成特征模板的比对实现身份识别。实验结果表明,ALMF模型相比单一生物特征识别和传统融合识别算法具有更强的鲁棒性和准确率。 展开更多
关键词 单一生物识别 注意力机制 人脸虹膜特征融合 模态特定低秩因子 特征级融合 特征比对 生物身份识别
在线阅读 下载PDF
基于注意力机制的双分支肺炎图像分类网络
17
作者 张吉友 张荣芬 刘宇红 《贵州大学学报(自然科学版)》 2024年第1期94-102,共9页
目前许多肺炎图像分类网络大多采用单分支网络对输入图像进行特征提取,这在一定程度上忽略了图像不同维度的特征信息。为了优化这种问题,提出一种融入注意力机制的双分支肺炎图像分类网络,利用VGG16网络和加入可分离卷积以及融入卷积注... 目前许多肺炎图像分类网络大多采用单分支网络对输入图像进行特征提取,这在一定程度上忽略了图像不同维度的特征信息。为了优化这种问题,提出一种融入注意力机制的双分支肺炎图像分类网络,利用VGG16网络和加入可分离卷积以及融入卷积注意力模块(convolution block attention module,CBAM)的CNN卷积神经网络进行双分支特征提取,能够关注到肺炎图像不同层次的特征信息,将2种网络分支的特征进行不同维度的融合,最后输入全连接层进行分类判决。结果表明,该网络在正常肺部、病毒性肺炎、新型冠状病毒肺炎(COVID-19)X-ray图像组成的测试集上取得了95%的平均准确率。经过消融试验证明,该网络加入的可分离卷积模块、注意力模块和特征融合对减少网络参数、提高网络分类的准确率起到明显作用。与其他网络的性能对比也表明该网络在肺炎图像分类上表现出较高的准确率和较强的鲁棒性。 展开更多
关键词 新冠肺炎 肺炎图像分类 注意力机制 分支特征提取和融合
在线阅读 下载PDF
基于高效通道注意力机制与多尺度特征融合的烟丝图像识别方法研究 被引量:2
18
作者 刘江鹏 牛群峰 +3 位作者 靳毅 陈霞 王莉 袁强 《河南农业科学》 北大核心 2022年第11期145-154,共10页
针对现有方法在识别烟丝类型中泛化能力差、准确率低的问题,提出了一种基于高效通道注意力机制与多尺度特征融合的烟丝类型识别方法。对采集的梗丝、膨胀叶丝、叶丝和再造烟丝4类烟丝图像进行降噪处理,处理后的图像经K-means聚类得到图... 针对现有方法在识别烟丝类型中泛化能力差、准确率低的问题,提出了一种基于高效通道注意力机制与多尺度特征融合的烟丝类型识别方法。对采集的梗丝、膨胀叶丝、叶丝和再造烟丝4类烟丝图像进行降噪处理,处理后的图像经K-means聚类得到图像的前景和后景并完成分割,提高输入图像的抗环境干扰能力和特征提取能力。在Inception-ResNet-V2网络中引入高效通道注意力机制,加强模型提取特征的能力;同时,将改进后的模块输出的特征图进行多尺度融合,增加特征代表性,降低过拟合风险。最后,在比较收敛性和准确性时,用PReLU和AdaBound代替了ReLU激活函数和Adam优化器。结果表明,提出的算法具有较好的泛化能力,能实现4类烟丝高效识别,最终识别精度为97.23%,单幅图像的检测时间为0.107 s。 展开更多
关键词 烟丝 K-MEANS算法 Inception网络 高效通道注意力机制 多尺度特征融合
在线阅读 下载PDF
基于空间通道注意力机制与多尺度融合的交通标志识别研究 被引量:8
19
作者 黄志强 李军 《南京邮电大学学报(自然科学版)》 北大核心 2022年第2期93-102,共10页
通过YOLOV3深度神经网络算法可以实现道路交通标志的自动检测与识别,由于YOLOV3运算量较大,很难在小型嵌入式平台上使用,针对这一问题,文中提出了改进型的轻量化YOLOV3-3ctiny神经网络模型。为了融合浅层特征图的空间信息与深层特征图... 通过YOLOV3深度神经网络算法可以实现道路交通标志的自动检测与识别,由于YOLOV3运算量较大,很难在小型嵌入式平台上使用,针对这一问题,文中提出了改进型的轻量化YOLOV3-3ctiny神经网络模型。为了融合浅层特征图的空间信息与深层特征图的语义信息,将第19层卷积层通过上采样后与第7层卷积层相连接,多尺度融合后输入YOLO层形成新的特征金字塔,以此提高小目标的识别率。同时,为使网络更加关注交通标志的细节信息,在特征金字塔网络中增添能够增强前景信息降低背景信息的空间通道注意力机制。使用Kmeans聚类算法对数据集作聚类处理,获得一组先验框。在长沙理工大学交通标志数据集上进行测试,实验结果表明,改进后算法的识别率达到91.8%,与YOLOV3-tiny算法相比提高了24.9个百分点,而与YOLOV3算法相比,每张图片的检测时间降低至0.133s,降低了49.6%,该算法具有较强的实时性和准确性。 展开更多
关键词 交通标志 轻量化网络 YOLOV3-3ctiny 多尺度融合 特征金字塔 空间通道注意力机制
在线阅读 下载PDF
双通道特征融合的真实场景点云语义分割方法 被引量:1
20
作者 孙刘杰 朱耀达 王文举 《计算机工程与应用》 CSCD 北大核心 2024年第12期160-169,共10页
真实场景点云不仅具有点云的空间几何信息,还具有三维物体的颜色信息,现有的网络无法有效利用真实场景的局部特征以及空间几何特征信息,因此提出了一种双通道特征融合的真实场景点云语义分割方法DCFNet(dual-channel feature fusion of ... 真实场景点云不仅具有点云的空间几何信息,还具有三维物体的颜色信息,现有的网络无法有效利用真实场景的局部特征以及空间几何特征信息,因此提出了一种双通道特征融合的真实场景点云语义分割方法DCFNet(dual-channel feature fusion of real scene for point cloud semantic segmentation)可用于不同场景下的室内外场景语义分割。更具体地说,为了解决不能充分提取真实场景点云颜色信息的问题,该方法采用上下两个输入通道,通道均采用相同的特征提取网络结构,其中上通道的输入是完整RGB颜色和点云坐标信息,该通道主要关注于复杂物体对象场景特征,下通道仅输入点云坐标信息,该通道主要关注于点云的空间几何特征;在每个通道中为了更好地提取局部与全局信息,改善网络性能,引入了层间融合模块和Transformer通道特征扩充模块;同时,针对现有的三维点云语义分割方法缺乏关注局部特征与全局特征的联系,导致对复杂场景的分割效果不佳的问题,对上下两个通道所提取的特征通过DCFFS(dual-channel feature fusion segmentation)模块进行融合,并对真实场景进行语义分割。对室内复杂场景和大规模室内外场景点云分割基准进行了实验,实验结果表明,提出的DCFNet分割方法在S3DIS Area5室内场景数据集以及STPLS3D室外场景数据集上,平均交并比(MIOU)分别达到71.18%和48.87%,平均准确率(MACC)和整体准确率(OACC)分别达到77.01%与86.91%,实现了真实场景的高精度点云语义分割。 展开更多
关键词 深度学习 通道特征融合 点云语义分割 注意力机制
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部