基于混合注意力的Transformer视觉目标跟踪算法被引量：4

Transformer visual object tracking algorithm based on mixed attention

导出

摘要基于Transformer的视觉目标跟踪算法能够很好地捕获目标的全局信息,但是,在对目标特征的表述上还有进一步提升的空间.为了更好地提升对目标特征的表达能力,提出一种基于混合注意力的Transformer视觉目标跟踪算法.首先,引入混合注意力模块捕捉目标在空间和通道维度中的特征,实现对目标特征上下文依赖关系的建模;然后,通过多个不同空洞率的平行空洞卷积对特征图进行采样,以获得图像的多尺度特征,增强局部特征表达能力;最后,在Transformer编码器中加入所构建的卷积位置编码层,为跟踪器提供精确且长度自适应的位置编码,提升跟踪定位的精度.在OTB 100、VOT 2018和LaSOT等数据集上进行大量实验,实验结果表明,通过基于混合注意力的Transformer网络学习特征间的关系,能够更好地表示目标特征.与其他主流目标跟踪算法相比,所提出算法具有更好的跟踪性能,且能够达到26帧/s的实时跟踪速度. The Transformer-based visual object tracking algorithm can capture the global information of the target well,but there is a possibility of further improvement in the presentation of the object features.To better improve the expression ability of object features,a Transformer visual object tracking algorithm based on mixed attention is proposed.First,the mixed attention module is introduced to capture the features of the object in the spatial and channel dimensions,so as to model the contextual dependencies of the target features.Second,the feature maps are sampled by multiple parallel dilated convolutions with different dilation rates to obtain the multi-scale features of the images,and enhance the local feature representation.Finally,the convolutional position encoding constructed is added to the Transformer encoder to provide accurate and length-adaptive position coding for the tracker,thereby improving the accuracy of tracking and positioning.The experimental results of the proposed algorithm on OTB 100,VOT 2018 and LaSOT show that by learning the relationship between features through the Transformer network based on mixed attention,the object features can be better represented.Compared with other mainstream object tracking algorithms,the proposed algorithm has better tracking performance and achieves a real-time tracking speed of 26 frames per second.

作者侯志强郭凡杨晓麟马素刚范九伦 HOU Zhi-qiang;GUO Fan;YANG Xiao-lin;MA Su-gang;FAN Jiu-lun(School of Computer,Xi’an University of Posts&Telecommunications,Xi’an 710121,China;School of Communication and Information Engineering,Xi’an University of Posts&Telecommunications,Xi’an 710121,China)

机构地区西安邮电大学计算机学院西安邮电大学通信与信息工程学院

出处《控制与决策》 EI CSCD 北大核心 2024年第3期739-748,共10页 Control and Decision

基金国家自然科学基金项目(62072370)。

关键词计算机视觉目标跟踪孪生网络深度学习注意力机制 TRANSFORMER computer vision object tracking siamese network deep learning attention mechanism Transformer

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1李玺,查宇飞,张天柱,崔振,左旺孟,侯志强,卢湖川,王菡子.深度学习的目标跟踪算法综述[J].中国图象图形学报,2019,24(12):2057-2080. 被引量：116
2卢湖川,李佩霞,王栋.目标跟踪算法综述[J].模式识别与人工智能,2018,31(1):61-76. 被引量：166
3陈志旺,王莹,宋娟,刁华康,彭勇.特征响应权重自适应的IoU网络跟踪算法改进[J].控制与决策,2022,37(7):1752-1762. 被引量：4
4刘如浩,张家想,金辰曦,卢先领.基于可变形卷积的孪生网络目标跟踪算法[J].控制与决策,2022,37(8):2049-2055. 被引量：9

二级参考文献6

1赵久奋,王明海.红外探测阵列对固体导弹尾焰跟踪定位的研究[J].固体火箭技术,2000,23(4):64-68. 被引量：6
2王亮,胡卫明,谭铁牛.人运动的视觉分析综述[J].计算机学报,2002,25(3):225-237. 被引量：276
3黄凯奇,陈晓棠,康运锋,谭铁牛.智能视频监控技术综述[J].计算机学报,2015,38(6):1093-1118. 被引量：404
4管皓,薛向阳,安志勇.深度学习在视频目标跟踪中的应用进展与展望[J].自动化学报,2016,42(6):834-847. 被引量：84
5陈志旺,王莹,宋娟,姚权允,彭勇.应用LTRNet卷积特征的ECO目标跟踪算法改进[J].控制理论与应用,2020,37(12):2601-2610. 被引量：1
6宋建辉,张甲,刘砚菊,于洋.基于条件对抗生成孪生网络的目标跟踪[J].控制与决策,2021,36(5):1110-1118. 被引量：5

共引文献271

1付兴武,杨哲,姜文涛.因式分解卷积运算的多尺度目标跟踪算法[J].辽宁工程技术大学学报（自然科学版）,2019,38(5):463-471.
2张兴国,周英迪,石新雨,罗霄月,顾杨旸.一种球机视频全景拼接及空间化方法[J].测绘科学,2022,47(5):203-211. 被引量：1
3马素刚,赵祥模,侯志强,王忠民,孙韩林.一种基于ResNet网络特征的视觉目标跟踪算法[J].北京邮电大学学报,2020(2):129-134. 被引量：9
4丁明远,蔡靖,周冕,薛彦兵,温显斌.跟踪状态自适应的判别式行人单目标跟踪算法研究[J].光电子．激光,2022,33(9):940-947. 被引量：1
5陈逸博.鲜花装扮迷人的巴黎[J].花卉,2000(3):34-34.
6安晓卫,崔丽菊.有限元图形的快速显示和消隐处理[J].沈阳工业学院学报,2000,19(1):12-16. 被引量：1
7李惠峰,易文峰,程晓明.基于近似动态规划的目标追踪控制算法[J].北京航空航天大学学报,2019,45(3):597-605. 被引量：3
8冯棐,吴小俊,徐天阳.基于子空间和直方图的多记忆自适应相关滤波目标跟踪算法[J].模式识别与人工智能,2018,31(7):612-624. 被引量：10
9范文兵,赵周鼎,王诗.多特征融合的自适应相关滤波跟踪算法[J].计算机工程与应用,2018,54(14):19-25. 被引量：8
10程嘉远.深度学习在雷达通信目标识别中的应用框架[J].现代雷达,2018,40(8):55-59. 被引量：8

同被引文献25

1马子玉,何明,刘祖均,顾凌枫,刘锦涛.无人机协同控制研究综述[J].计算机应用,2021,41(5):1477-1483. 被引量：17
2李玲玲,韩瑞玲,张晓燕.城市低空空域可用空间识别与容量评估——以北京市为例[J].科学技术与工程,2021,21(19):8253-8261. 被引量：7
3杨彪,范福成,杨吉成,蔡英凤,王海.基于动作预测与环境条件的行人过街意图识别[J].汽车工程,2021,43(7):1066-1076. 被引量：5
4WANG Zhi,WANG Ershen,HUANG Yufeng,YANG Siqi,XU Song.SiamADN:Siamese Attentional Dense Network for UAV Object Tracking[J].Transactions of Nanjing University of Aeronautics and Astronautics,2021,38(4):587-596. 被引量：2
5张宏伟,李晓霞,朱斌,张杨.基于孪生神经网络的两阶段目标跟踪方法[J].红外与激光工程,2021,50(9):333-344. 被引量：7
6WANG Zhi,HU Wei,WANG Ershen,HONG Chen,XU Song,LIU Meizhi.Enhancement Dataset for Low Altitude Unmanned Aerial Vehicle Detection[J].Transactions of Nanjing University of Aeronautics and Astronautics,2021,38(6):914-926. 被引量：4
7陈志旺,王莹,宋娟,刁华康,彭勇.特征响应权重自适应的IoU网络跟踪算法改进[J].控制与决策,2022,37(7):1752-1762. 被引量：4
8赵玥萌,刘会刚.基于优化YOLOv4算法的低空无人机检测与跟踪[J].激光与光电子学进展,2022,59(12):387-396. 被引量：8
9周文豪,杨帅东,赵书朵.增强特征信息的孪生网络无人机目标跟踪方法[J].计算机工程与设计,2022,43(8):2325-2333. 被引量：1
10刘如浩,张家想,金辰曦,卢先领.基于可变形卷积的孪生网络目标跟踪算法[J].控制与决策,2022,37(8):2049-2055. 被引量：9

引证文献4

1季善斌,张威,徐嵩,王尔申,于腾丽,张宏轩,杨健.基于注意力机制改进孪生网络的无人机跟踪算法[J].指挥信息系统与技术,2024,15(4):50-55.
2侯志强,杨晓麟,马素刚,王云龙,余旺盛,王昀琛.基于特征增强和历史帧选择的Transformer视觉跟踪算法[J].控制与决策,2024,39(10):3506-3512. 被引量：2
3桑海峰,刘玉龙,刘泉恺.基于混合注意力机制的多信息行人过街意图预测[J].控制与决策,2024,39(12):3946-3954.
4陈志旺,杨天宇,曹索航,吕昌昊,彭勇.基于稀疏注意力的孪生网络目标跟踪算法[J].控制与决策,2024,39(12):4017-4026.

二级引证文献2

1丁钰峰,杨志钢,郑滨汐.结合注意力和细化模块的反无人机目标跟踪[J].应用科技,2024,51(5):235-242.
2常青,郑世祺,邓宇书,唐小琦.基于改进ResNet50和迁移学习的竹片表面缺陷检测方法[J].控制与决策,2025,40(2):432-440.

1陶洋,唐函,欧双江,周婉怡.稀疏约束与时间一致的背景感知相关滤波目标跟踪[J].小型微型计算机系统,2024,45(3):657-663. 被引量：2
2何银,何宇,聂祥论.基于CWT-CNN-LSTM的配电网单相接地故障选线方法分析[J].集成电路应用,2024,41(1):418-421.
3朱代先,阮小曼,刁弘伟,刘佳,刘树林.基于改进TLD的运动目标跟踪算法研究[J].电子测量技术,2023,46(18):122-128. 被引量：1
4范文兵,张璐璐.基于核相关滤波和卡尔曼滤波预测的混合跟踪方法[J].郑州大学学报（工学版）,2024,45(2):20-26. 被引量：2
5甘美,艾则孜•阿不力米提.维吾尔语专业学生辅音/q/的语音偏误分析——以新疆大学中国少数民族语言(维吾尔语)专业学生为例[J].现代语言学,2024,12(2):617-626.
6Peng Feng,Lu Wang,Xiawen Li,Wenjie Ding,Zhe Chen.SS-LASS Zircon Dating Deciphering Multiple Episodes of Anatexis in a Deeply-Subducted Continental Crust:An Example from Sulu Orogen,China[J].Journal of Earth Science,2024,35(1):85-98. 被引量：2

控制与决策

2024年第3期

浏览历史

内容加载中请稍等...

基于混合注意力的Transformer视觉目标跟踪算法被引量：4

参考文献4

二级参考文献6

共引文献271

同被引文献25

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于混合注意力的Transformer视觉目标跟踪算法 被引量：4

参考文献4

二级参考文献6

共引文献271

同被引文献25

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于混合注意力的Transformer视觉目标跟踪算法被引量：4