期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
一种基于Filter Faster R-CNN的数字PCR液滴检测技术
1
作者 张一鹏 陈波 +4 位作者 李家奇 梁业东 张华剑 吴文明 张煜 《南方医科大学学报》 CAS CSCD 北大核心 2024年第2期344-353,共10页
目的研究液滴数字聚合酶链式反应(ddPCR)液滴检测技术,去除图像中灰尘、气泡、芯片表面的划痕以及微小凹陷等因素产生的异常点对结果的影响,实现高通量、稳定和准确的ddPCR液滴的自动检测。方法提出Filter Faster R-CNN ddPCR液滴检测... 目的研究液滴数字聚合酶链式反应(ddPCR)液滴检测技术,去除图像中灰尘、气泡、芯片表面的划痕以及微小凹陷等因素产生的异常点对结果的影响,实现高通量、稳定和准确的ddPCR液滴的自动检测。方法提出Filter Faster R-CNN ddPCR液滴检测模型。使用Faster R-CNN生成液滴预测框,之后使用异常点过滤模块(Filter)去除阳性液滴预测框中的异常点。以诺如病毒片段的质粒为模板进行ddPCR实验,建立一个ddPCR数据集,用于模型的训练(2462例,约占78.56%)和测试(672例,约占21.44%)。对异常点过滤模块的3个过滤支路在验证集上进行消融实验,通过与其他ddPCR液滴检测模型进行比较的对比实验以及进行ddPCR的绝对定量实验。结果在少尘和多尘的环境中,Filter Faster R-CNN阳性液滴准确率为98.23%和88.35%,综合指标F1分数分别达到了99.15%和99.14%,高于其他相比较的模型。独立样本T检验的结果证明,相比未添加过滤模块的网络,添加过滤模块后能够显著提示模型在多尘环境中的阳性准确率。在ddPCR绝对定量实验中,将商业化流式检测设备的结果作为标准浓度,绘制了回归线。结果显示,回归线斜率为1.0005,截距为-0.025,决定系数达到了0.9997,二者结果高度一致。结论本文提出了一种基于Filter Faster R-CNN的ddPCR液滴检测技术,为在多种环境条件下的ddPCR实验提供了鲁棒的液滴检测方法。 展开更多
关键词 ddPCR Filter Faster R-CNN 异常点去除
在线阅读 下载PDF
触发采集式三维超声成像系统的设计与实现 被引量:3
2
作者 许程耀 李赣萍 +3 位作者 黄庆华 杨豪豪 王青 冯前进 《南方医科大学学报》 CAS CSCD 北大核心 2021年第5期767-774,共8页
目的实现基于Verasonics^(TM)Vantage128开放式超声平台的触发采集式三维超声成像系统,验证该系统的三维超声成像可行性。方法触发采集式三维超声成像系统由探头运动控制、图像采集存储以及三维重建显示三部分组成。为提升图像采集的精... 目的实现基于Verasonics^(TM)Vantage128开放式超声平台的触发采集式三维超声成像系统,验证该系统的三维超声成像可行性。方法触发采集式三维超声成像系统由探头运动控制、图像采集存储以及三维重建显示三部分组成。为提升图像采集的精度,该系统通过采集脉冲控制超声平台外部触发,配合探头机械扫描,完成图像采集;并采用基于体素的三维重建方法进行图像重建与显示;最后,自编超声平台的用户控制界面,直接调控系统各部分功能,并进行标准体模扫描测试以及人体颈动脉扫描,进而评估体模与颈动脉的三维重建效果。结果本研究构建了触发采集式三维超声成像系统,标准体模扫描测试及颈动脉三维成像实验结果显示,该系统的各部分具备应有功能,可通过自编用户控制界面控制系统软件,对待测物体进行扫描、图像采集和重建显示,得到完整清晰的三维视图和三方向切面图。结论本文所设计和实现的三维超声成像系统能够实现对体模与生物组织的三维超声成像,为后续相关研究和临床应用奠定了良好基础。 展开更多
关键词 三维超声成像系统 触发采集 开放式超声平台 机械扫描
在线阅读 下载PDF
多参数多区域MRI影像组学特征与临床信息联合模型可有效预测脑胶质瘤患者生存期 被引量:1
3
作者 黄晓茵 陈凤莲 +1 位作者 张煜 梁淑君 《南方医科大学学报》 CAS CSCD 北大核心 2024年第10期2004-2014,共11页
目的探讨脑胶质瘤患者肿瘤亚区影像组学特征,评估其对患者生存期的预后价值。方法对388例胶质瘤患者的术前MRI多序列影像和临床数据进行回顾性分析,从瘤周水肿区域、肿瘤核心区以及全肿瘤区域提取T1、T2、T1加权对比增强(T1CE)、液体衰... 目的探讨脑胶质瘤患者肿瘤亚区影像组学特征,评估其对患者生存期的预后价值。方法对388例胶质瘤患者的术前MRI多序列影像和临床数据进行回顾性分析,从瘤周水肿区域、肿瘤核心区以及全肿瘤区域提取T1、T2、T1加权对比增强(T1CE)、液体衰减反转恢复(FLAIR)序列的影像组学特征。将病例按照7∶3分为训练集(271例)和测试集(117例)。利用随机生存森林算法在训练集中筛选与总生存期相关的影像组学特征,并构建影像组学评分(Rad-score)。根据Rad-score将患者分为高、低风险组,使用Kaplan-Meier分析两组生存差异。建立瘤周水肿区、肿瘤核心区和全肿瘤区域的Cox比例风险回归模型,并通过五折交叉验证及受试者工作特征曲线下面积评估模型1年、3年生存率的预测效能,采用10例胶质瘤患者作外部验证。选择表现最优的模型进行生存期预测情况的列线图分析。结果肿瘤核心区、瘤周水肿区和全肿瘤区域分别筛选出的影像组学特征数量分别为5、7、5,根据Rad-score,两风险组在训练集和测试集的总生存期存在差异(P<0.05)。单因素和多因素Cox分析显示,年龄、异柠檬酸脱氢酶状态和Rad-score是总生存期的独立影响因素。联合模型在训练集和测试集中的AUC表现优于单一Rad-score模型,其中全肿瘤模型的1年、3年生存率预测AUC分别为0.750、0.778(训练集),0.764、0.800(测试集)和0.938、0.917(外部验证集)。结论基于术前多模态MRI影像组学特征与临床信息联合构建的预测模型能有效预测胶质瘤患者的生存期。 展开更多
关键词 胶质瘤 影像组学 磁共振成像 机器学习 预后分析
在线阅读 下载PDF
“E骨”-反肩置换术一站式术前规划系统
4
作者 李穆 米昀 +4 位作者 沈世文 吴心远 严静东 陈滨 曹蕾 《南方医科大学学报》 CAS CSCD 北大核心 2024年第5期967-973,共7页
目的为提高反肩置换术术前规划的精准度和效率,本研究开发了“E骨”—反肩置换术一站式术前规划系统。方法利用nnU-net深度神经网络进行肩胛骨分割,获得精确的肩胛骨分割结果;结合骨密度、上下倾角和入钉长度3个关键因素自动定位基座,... 目的为提高反肩置换术术前规划的精准度和效率,本研究开发了“E骨”—反肩置换术一站式术前规划系统。方法利用nnU-net深度神经网络进行肩胛骨分割,获得精确的肩胛骨分割结果;结合骨密度、上下倾角和入钉长度3个关键因素自动定位基座,并计算出手术规划所需定量参数;结合关节盂形态和基座定位信息生成个性化导板;编写系统界面,将各部分功能模块化组装便于使用,提供交互操作与规划结果显示的功能。结果构建出“E骨”术前规划系统。本系统与Mimics系统相比,减少了规划过程中繁琐的手动调整,平均入钉长度规划结果长于Mimics系统,且规划时间缩短86%。本系统肩胛骨分割精度达到99.93%,较Mimics更高。结论本研究为反肩置换术提供了一套一站式的高效、精准的术前规划方案,具有广泛的临床应用前景。 展开更多
关键词 一站式 反肩置换术 术前规划系统 肩胛骨分割 基座定位
在线阅读 下载PDF
基于多模态多示例学习的免疫介导性肾小球疾病自动分类方法
5
作者 龙楷兴 翁丹仪 +3 位作者 耿舰 路艳蒙 周志涛 曹蕾 《南方医科大学学报》 CAS CSCD 北大核心 2024年第3期585-593,共9页
目的探讨如何利用多模态深度学习方法,联合光学显微镜(OM)、免疫荧光显微镜(IM)及透射电子显微镜(TEM)对应的3种图像进行免疫介导性肾小球疾病分类。方法基于273例患者的病理图像进行回顾性研究,构建多模态多示例模型对3种免疫介导性的... 目的探讨如何利用多模态深度学习方法,联合光学显微镜(OM)、免疫荧光显微镜(IM)及透射电子显微镜(TEM)对应的3种图像进行免疫介导性肾小球疾病分类。方法基于273例患者的病理图像进行回顾性研究,构建多模态多示例模型对3种免疫介导性的肾小球疾病——免疫球蛋白A肾病(IgAN)、膜性肾病(MN)、狼疮性肾炎(LN)进行分类。该模型采用示例水平的多示例学习(I-MIL)方法挑选患者的TEM图像并与同一患者的OM图像和IM图像进行多模态特征融合。通过该模型与单模态、双模态模型的比较,探究3种模态之间的不同组合形式以及模态特征融合方式的特性。结果联合OM、IM以及TEM图像建立的多模态多示例模型准确率为(88.34±2.12)%,优于准确率为(87.08±4.25)%的最优的单模态模型,以及准确率为(87.92±3.06)%的最优的双模态模型。结论本研究成功建立基于OM、IM及TEM三种模态图像的多模态多示例模型,并验证了采用多示例学习结合多模态学习方法对免疫介导性肾小球疾病分类的有效性。 展开更多
关键词 肾活检病理 肾小球疾病 深度学习 多模态融合 多示例学习
在线阅读 下载PDF
基于多尺度聚合和共享注意力的注视估计模型
6
作者 施赛龙 方智文 《计算机应用》 CSCD 北大核心 2024年第7期2047-2054,共8页
注视估计是从人脸图像中估计3D注视方向的方法,其中与注视直接相关的眼睛细节信息在人脸图像中集中且对注视估计具有显著影响。然而现有的注视估计模型忽略了小尺度的眼睛细节,且容易被图像特征中与注视无关的信息淹没。为此,提出一种... 注视估计是从人脸图像中估计3D注视方向的方法,其中与注视直接相关的眼睛细节信息在人脸图像中集中且对注视估计具有显著影响。然而现有的注视估计模型忽略了小尺度的眼睛细节,且容易被图像特征中与注视无关的信息淹没。为此,提出一种基于多尺度聚合和共享注意力的模型以增强特征的表达能力。首先,使用分流自注意力聚合图像中不同尺度的眼睛和人脸信息,并引导模型学习不同尺度对象之间的相关性,以此处理模型对图像中眼睛细节的遗漏问题;其次,通过建立共享注意力来捕获图像之间的共享特征,减少对注视无关特征的关注;最后,结合多尺度聚合和共享注意力,进一步提高注视估计的精度。在公开数据集MPIIFaceGaze、Gaze360、Gaze360_Processed和GAFA-Head上,所提模型的平均角度误差比GazeTR(Gaze TRansformer)降低了5.74%、4.09%、4.82%和10.55%。在Gaze360背对相机的困难图像上,所提模型的平均角度误差比GazeTR降低了4.70%。实验结果表明,所提模型能有效聚合多尺度的注视信息和共享注意力,提高注视估计的准确性和鲁棒性。 展开更多
关键词 注视估计 共享注意力 多尺度聚合 共享特征 计算机视觉
在线阅读 下载PDF
基于高阶奇异值分解和Rician噪声校正模型的扩散加权图像去噪算法 被引量:8
7
作者 徐朴 郭莉 +1 位作者 冯衍秋 张鑫媛 《南方医科大学学报》 CAS CSCD 北大核心 2021年第9期1400-1408,共9页
目的研究一种新颖的基于高阶奇异值分解(HOSVD)的扩散加权图像去噪算法,用以提高扩散加权(DW)图像的信噪比以及后续量化参数的准确性。方法我们提出一种基于HOSVD稀疏约束和Rician噪声校正模型的去噪方法,将Rician噪声信号期望融合到传... 目的研究一种新颖的基于高阶奇异值分解(HOSVD)的扩散加权图像去噪算法,用以提高扩散加权(DW)图像的信噪比以及后续量化参数的准确性。方法我们提出一种基于HOSVD稀疏约束和Rician噪声校正模型的去噪方法,将Rician噪声信号期望融合到传统的HOSVD去噪框架中,从而能够直接对带有Rician噪声的DW图像进行去噪。此外,考虑到对相似块组成的高维数组进行HOSVD去噪处理,容易引入条形伪影,因此本文直接对每个局部DW图像块进行HOSVD去噪,从而解决了条形伪影问题。为了验证所提方法的有效性,我们将本方法与低秩+边缘约束(LR+Edge)、基于全局指导下的局部高阶奇异值分解(GL-HOSVD)、基于块匹配的三维滤波(BM3D)和非局部均值(NLM)4种去噪算法进行了实验对比。结果实验结果表明,所提方法能够有效降低DW图像噪声,同时较好的保留图像细节以及边缘结构信息。无论是从DW图像的峰值信噪比(PSNR)和结构相似性(SSIM)以及各向异性分数均方根误差定量指标,还是从去噪图像和各向异性分数图的视觉效果来看,本算法都要明显优于LR+Edge,BM3D和NLM。此外,GL-HOSVD虽然可以得到较好的去噪结果,但是在高噪声水平下,会引入条形伪影,而本文方法不但可以得到较好的去噪结果,并且不存在伪影问题。结论本文提出了一种新颖的HOSVD去噪方法,可以直接处理带有Rician噪声的DW图像,并且解决了同类算法中伪影问题,去噪效果明显,能够为临床提供更准确的量化参数结果,更好服务于临床影像诊断。 展开更多
关键词 扩散磁共振成像 图像去噪 高阶奇异值分解 Rician噪声
在线阅读 下载PDF
肾小球超微结构分割算法:基于区域级对比学习的深度模型 被引量:1
8
作者 林国钰 张桢泰 +4 位作者 路艳蒙 耿舰 周志涛 路利军 曹蕾 《南方医科大学学报》 CAS CSCD 北大核心 2023年第5期815-824,共10页
目的为了提高深度模型对电子显微镜图像中肾小球超微结构的分割性能,提出了一种基于超微结构语义相似性的区域级自监督对比学习方法USRegCon。方法USRegCon使用大量无标记数据对模型进行预训练,该预训练过程包括3个步骤:(1)模型对图像... 目的为了提高深度模型对电子显微镜图像中肾小球超微结构的分割性能,提出了一种基于超微结构语义相似性的区域级自监督对比学习方法USRegCon。方法USRegCon使用大量无标记数据对模型进行预训练,该预训练过程包括3个步骤:(1)模型对图像中超微结构信息进行编码和解码,并根据超微结构的语义相似性自适应地将图像划分为多个区域;(2)依据所划分的区域,使用区域池化操作提取出每个区域的一阶灰度区域表示和深度语义区域表示;(3)对于一阶灰度区域表示,构建了灰度损失函数,目标为最小化区域内的灰度差异和最大化区域间的灰度差异。对于深度语义区域表示,构建了语义损失函数,目标为最大化表示空间中正区域对的相似性和负区域对的差异性。这两个损失函数将联合对模型进行预训练。结果基于私有数据集GlomEM,USRegCon在肾小球滤过屏障三层超微结构的分割任务中,对基底膜、内皮细胞和足细胞均获得了良好的分割结果,Dice系数分别为85.69±0.13%、74.59±0.13%和78.57±0.16%。该结果优于现有的多种图像级、像素级和区域级自监督对比学习方法,并逼近基于大规模标记数据集ImageNet的全监督预训练方法。结论USRegCon促进模型从大量无标记数据中学习有益的区域表示,弥补了标记数据不足的缺陷,提升了模型对肾小球超微结构的识别和边缘分割能力。 展开更多
关键词 肾小球超微结构分割 电子显微镜 标记数据稀缺 自监督对比学习
在线阅读 下载PDF
基于3D U-Net和DTI模型约束的扩散张量场估计方法 被引量:1
9
作者 麦兆华 李嘉龙 +1 位作者 冯衍秋 张鑫媛 《南方医科大学学报》 CAS CSCD 北大核心 2023年第7期1224-1232,共9页
目的为从少量的低信噪比扩散加权(DW)图像中估计得到准确的扩散张量成像(DTI)量化参数,本文提出一种基于3D U-Net和DTI模型约束的扩散张量场估计网络(3D DTI-Unet)。方法3D DTI-Unet的输入为有噪声的扩散磁共振成像(dMRI)数据(包含1幅... 目的为从少量的低信噪比扩散加权(DW)图像中估计得到准确的扩散张量成像(DTI)量化参数,本文提出一种基于3D U-Net和DTI模型约束的扩散张量场估计网络(3D DTI-Unet)。方法3D DTI-Unet的输入为有噪声的扩散磁共振成像(dMRI)数据(包含1幅非扩散加权图像与6幅不同扩散编码方向的DW图像),通过3D U-Net网络预测得到降噪后的非扩散加权图像以及准确的扩散张量场,并通过DTI模型重建得到dMRI数据,将其与dMRI数据的真实值进行比较来优化网络,从而保证dMRI数据与扩散张量场的物理模型一致性。为验证所提方法的有效性,与Marchenko-Pastur主成分分析(MP-PCA)和基于全局指导下的局部高阶奇异值分解(GL-HOSVD)这两种扩散加权图像去噪算法进行实验对比。结果从DW图像、扩散张量场以及DTI量化参数的定量分析结果以及视觉效果来看,所提方法均优于MP-PCA与GL-HOSVD。结论本文所提方法能够从1幅非扩散加权图像和6幅DW图像得到准确的DTI量化参数,可减少临床采集时间,提高临床量化诊断的可靠性。 展开更多
关键词 扩散张量成像 张量场估计 3D U-Net Rician噪声 图像去噪
在线阅读 下载PDF
基于正交视角X线图像重建的3D/2D配准方法 被引量:1
10
作者 弥佳 周宇佳 冯前进 《南方医科大学学报》 CAS CSCD 北大核心 2023年第9期1636-1643,共8页
目的研究一种用于脊柱外科手术导航中术前CT图像与术中X线图像的3D/2D配准方法。方法本文构建了一个基于3D图像重建的3D/2D配准算法。该算法对2D正交视角X线图像进行3D图像重建,将问题转换为了3D/3D配准;结合了重建和配准两个任务构建... 目的研究一种用于脊柱外科手术导航中术前CT图像与术中X线图像的3D/2D配准方法。方法本文构建了一个基于3D图像重建的3D/2D配准算法。该算法对2D正交视角X线图像进行3D图像重建,将问题转换为了3D/3D配准;结合了重建和配准两个任务构建端对端的框架,并最终在3D流形空间中度量测地距离完成配准。结果我们在公开数据集CTSpine1k上进行了实验。在两个具有不同大小初始配准误差的测试集上进行测试,对于较小初始误差的数据,达到了0.115°±0.095°的旋转估计误差和0.144±0.124 mm的平移估计误差;对于较大初始误差的数据,达到了0.792°±0.659°的旋转估计误差和0.867±0.701mm的平移估计误差。结论本文提出的方法能在满足实时需求的同时,实现鲁棒、精确的3D/2D配准,有望进一步提高脊柱外科导航性能。 展开更多
关键词 3D/2D配准 手术导航 重建 深度学习
在线阅读 下载PDF
基于Gabor滤波和Scharr算法的手掌静脉图像增强方法 被引量:2
11
作者 李胜勋 黄靖 《北京生物医学工程》 2023年第5期488-495,共8页
目的为了改善采集到的手掌静脉图像质量,提高静脉识别的准确性,提出一种基于Gabor滤波和Scharr边缘检测算子的手掌静脉图像增强方法。方法首先对原始手掌静脉图像截取感兴趣区域(region of interest,ROI)后进行滤波去噪,其次通过自适应... 目的为了改善采集到的手掌静脉图像质量,提高静脉识别的准确性,提出一种基于Gabor滤波和Scharr边缘检测算子的手掌静脉图像增强方法。方法首先对原始手掌静脉图像截取感兴趣区域(region of interest,ROI)后进行滤波去噪,其次通过自适应直方图均衡化提高图像对比度,然后采用6个方向的Gabor滤波器提取手掌静脉纹路,并通过Scharr算子实现静脉纹路增强。采用全参考和无参考相结合的图像定量质量评价指标峰值信噪比(peak signal to noise ratio,PSNR)、均方误差(mean squared error,MSE)、灰度标准差、图像清晰度(no reference structural sharpness,NRSS)进行评估。结果本文方法PSNR为29.460,MSN为73.619,图像灰度标准差87.715、NRSS为0.341,结果表明图像失真程度最小,静脉纹路得到有效增强。结论本文方法能够有效增强手掌静脉纹路的对比度,改善图像质量。 展开更多
关键词 手掌静脉 图像增强 Scharr边缘检测算子 GABOR滤波
在线阅读 下载PDF
基于稀疏视角合成引导脊柱手术导航中的3D/2D配准
12
作者 张文聪 赵磊 +1 位作者 周宇佳 冯前进 《数字医学与健康》 2024年第1期4-15,共12页
目的开发一种基于稀疏视角合成的深度学习框架,以引导术前CT图像和术中X线图像的3D/2D配准,从而应用于图像引导的脊柱外科手术导航。方法提出一种新颖的稀疏视角合成引导配准(SVSCReg)方法。SVSCReg包括稀疏视角循环合成路径、自重建路... 目的开发一种基于稀疏视角合成的深度学习框架,以引导术前CT图像和术中X线图像的3D/2D配准,从而应用于图像引导的脊柱外科手术导航。方法提出一种新颖的稀疏视角合成引导配准(SVSCReg)方法。SVSCReg包括稀疏视角循环合成路径、自重建路径和渐进式3D位姿估计路径。(1)稀疏视角循环合成路径提取术中3D特征:基于生成对抗网络从单一视角合成其对应正交位视角,并循环此过程,合成过程引入可微分反投影模块以重建术中3D几何特征,将3D/2D配准转化为特征水平上的3D/3D配准;(2)自重建路径提取术前3D特征:基于自重建路径,提取丰富且关键的术前3D几何特征;(3)渐进式3D位姿估计路径:将术前3D几何特征作为固定特征,正交位视角循环生成得到两个术中3D几何特征作为浮动特征,两次渐进式估计得到最终的位姿参数。结果在公开的CTSpinelk大规模脊柱数据集上验证了该方法。相比于传统方法和其他深度学习方法,SVSCReg都获得了较好的配准结果。对于(±10°,±10mm)小位移数据集I,平均旋转和平移估计误差分别为(0.08±0.07)°、(0.12+0.16)mm;对于(±45,±50mm)大位移数据集Ⅱ,平均旋转和平移估计误差分别为(0.76±0.80)(0.83±0.89)mm。两个数据集的平均目标配准误差分别为(0.28±0.21)、(2.03±1.25)mm。结论SVSCReg仅基于术中单一视角图像作为输人提取术中3D特征,减轻了以往文献中多视角和正交位视角提取术中3D特征的限制性约束;3D特征水平估计位姿参数保证了算法鲁棒性(robustness)和实时性;渐进式位姿估计参数有效解决大位姿差异估计问题。综上,SVSCReg对于临床脊柱疾病手术规划和手术导航系统具有巨大的潜力。 展开更多
关键词 3D/2D配准 手术导航 视角合成 几何特征 渐进式
原文传递
融合自注意力和自编码器的视频异常检测 被引量:6
13
作者 梁家菲 李婷 +3 位作者 杨佳琪 李亚楠 方智文 杨丰 《中国图象图形学报》 CSCD 北大核心 2023年第4期1029-1040,共12页
目的视频异常检测通过挖掘正常事件样本的模式来检测不符合正常模式的异常事件。基于自编码器的模型广泛用于视频异常检测领域,由于自监督学习的特征提取具有一定盲目性,使得网络的特征表达能力有限。为了提升模型对正常模式的学习能力... 目的视频异常检测通过挖掘正常事件样本的模式来检测不符合正常模式的异常事件。基于自编码器的模型广泛用于视频异常检测领域,由于自监督学习的特征提取具有一定盲目性,使得网络的特征表达能力有限。为了提升模型对正常模式的学习能力,提出一种基于Transformer和U-Net的视频异常检测方法。方法首先,编码器对输入的连续帧进行下采样提取低层特征,并将最后一层特征图输入Transformer编码全局信息,学习特征像素之间的相关信息。然后解码器对编码特征进行上采样,通过跳跃连接与编码器中相同分辨率的低层特征融合,将全局空间信息与局部细节信息结合从而实现异常定位。针对近景康复动作的异常反馈需求,本文基于周期性动作收集了一个室内近景数据集,并进一步引入动态图约束引导网络关注近景周期性运动区域。结果实验在4个室外公开数据集和1个室内近景数据集上与同类方法比较。在室外数据集CUHK(Chinese University of Hong Kong)Avenue,UCSD Ped1(University of California,San Diego,pedestrian1),UCSD Ped2,LV(live videos)中,本文算法的帧级AUC(area under curve)值分别提高了1%,0.4%,1.1%,6.8%。在室内数据集中,本文算法相比同类算法提升了1.6%以上。消融实验结果分别验证了Transformer模块以及动态图约束的有效性。结论本文将U-Net网络与基于自注意力机制的Transformer网络结合,能够提升模型对正常模式的学习能力,从而有效检测视频中的异常事件。 展开更多
关键词 异常检测 卷积神经网络(CNN) Transformer编码器 自注意力机制 自监督学习
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部