一种快速的多尺度多输入编码树单元互补分类网络

A Multi-scale-multi-input Complementation Classification Network for Fast Coding Tree Unit Partition

下载PDF

导出

摘要深度神经网络(DNN)已被广泛应用到高效视频编码(HEVC)编码树单元(CTU)的深度划分中,显著降低了编码复杂度。然而现有的基于DNN的CTU深度划分方法却忽略了不同尺度编码单元(CU)间的特征相关性和存在着分类错误累积等缺陷。基于此,该文提出一种多尺度多输入的互补分类网络(MCCN)来实现更高效且更准确的HEVC帧内CTU深度划分。首先,提出一种多尺度多输入的卷积神经网络(MMCNN),通过融合不同尺度CU的特征来建立CU间的关联,进一步提升网络的表达能力。然后,提出一种互补的分类策略(CCS),通过结合二分类和三分类,并采用投票机制来决定CTU中每个CU的最终深度值,有效避免了现有方法中存在的错误累积效应,实现了更准确的CTU深度划分。大量的实验结果表明,该文所提MCCN能够更大程度降低HEVC编码的复杂度,同时实现更准确的CTU深度划分:仅以增加3.18%的平均增量比特率(BD-BR)为代价,降低了71.49%的平均编码复杂度。同时,预测32×32 CU和16×16 CU的深度准确率分别提升了0.65%~0.93%和2.14%~9.27%。 Deep Neural Networks(DNN)have been widely applied to Coding Tree Unit(CTU)partition of intra-mode High Efficiency Video Coding(HEVC)for reducing the HEVC encoding complexity,however,existing DNN-based CTU partition methods always neglect the correlation of features between Coding Units(CU)at different scales and suffer from the accumulation of classification errors.Therefore,in this paper,a Multi-scale-multi-input Complementation Classification Network(MCCN)for faster and more accurate CTU partition is proposed.First,a Multi-scale Multi-input Convolutional Neural Network(MMCNN)is proposed,which builds up the correlation of features between CUs at different scales by fusing multi-scale CU features.Therefore,our MMCNN possess more powerful representation abilities.Second,a Complementary Classification Strategy(CCS)is proposed,in which the final depth prediction results for each CU are determined by combining the results of multi-classification with the results of binary classification and triplex classification with the voting mechanism.The proposed CCS avoids the accumulation of classification errors and achieves more accurate CTU partition.Extensive experiments demonstrate that our MCCN achieves lower HEVC encoding complexity and more accurate CTU partition:reduce the average encoding complexity by 71.49%only at the cost of a 3.18%average Bj?ntegaard Delta Bit-Rate(BD-BR).And the average accuracies of 32×32 CU depth prediction and 16×16 CU depth prediction are increased by 0.65%~0.93%and 2.14%~9.27%respectively.

作者唐述周广义谢显中赵瑜杨书丽 TANG Shu;ZHOU Guangyi;XIE Xianzhong;ZHAO Yu;YANG Shuli(College of Computer Science and Technology,Chongqing University of Posts and Telecommunications,Chongqing 400064,China)

机构地区重庆邮电大学计算机科学与技术学院

出处《电子与信息学报》 EI CAS CSCD 北大核心 2024年第9期3646-3653,共8页 Journal of Electronics & Information Technology

基金国家自然科学基金(61601070) 重庆市自然科学基金面上项目(CSTB2023NSCQ-MSX0680) 重庆市教育委员会科学技术研究重大项目(KJZD-M202300101) 重庆邮电大学博士研究生创新人才项目(BYJS202217)。

关键词深度神经网络帧内高效视频编码特征表示编码树单元深度划分多尺度多输入互补分类 Deep Neural Networks(DNN) Intra-mode High Efficiency Video Coding(HEVC) Features Representation Coding Tree Unit(CTU)partition Multi-scale-multi-input Complementation classification

分类号 TN939.1 [电子电信—信号与信息处理] TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1贾克斌,崔腾鹤,刘鹏宇,刘畅.基于深层特征学习的高效率视频编码中帧内快速预测算法[J].电子与信息学报,2021,43(7):2023-2031. 被引量：7

二级参考文献3

1齐美彬,陈秀丽,杨艳芳,蒋建国,金玉龙,张俊杰.高效率视频编码帧内预测编码单元划分快速算法[J].电子与信息学报,2014,36(7):1699-1705. 被引量：18
2王莉,曹一凡,杜高明,刘冠宇,王晓蕾,张多利.一种低延迟的3维高效视频编码中深度建模模式编码器[J].电子与信息学报,2019,41(7):1625-1632. 被引量：5
3汤进,彭勇.基于时空相关与纹理特性的HEVC编码单元快速划分算法[J].计算机与数字工程,2019,47(7):1753-1756. 被引量：2

共引文献6

1梁鸽,刚伟,肖振新.监管场所视频标注技术的研究与应用[J].警察技术,2022(1):20-24.
2罗雪.基于深度学习的视频编码技术研究[J].信息与电脑,2022,34(23):194-196. 被引量：2
3张婷,于涛,王欣.基于深度学习的体育视频关键姿态提取研究[J].信息技术,2023,47(5):1-5.
4程德强,寇旗旗,江鹤,徐飞翔,宋天舒,王晓艺,钱建生.全矿井智能视频分析关键技术综述[J].工矿自动化,2023,49(11):1-21. 被引量：18
5李青燕,田军.面向嵌入式微处理器的高性能视频编解码算法[J].现代电子技术,2024,47(10):34-38. 被引量：2
6范俊宇,宋立锋.基于神经网络的HEVC帧内预测组合快速算法[J].广东工业大学学报,2024,41(3):131-140.

1于海,杨磊,高阳,刘枫琪,刘鹏宇,孙萱,张悦.基于块编码特点的压缩视频质量增强算法[J].北京工业大学学报,2024,50(9):1069-1076.
2李轩,冷雨馨.基于卷积神经网络的HEVC帧内预测算法优化[J].现代电子技术,2024,47(11):69-77. 被引量：1
3李巧君,李江岱,王爱菊.基于降维字典学习的高维数据分类策略[J].计算机应用与软件,2024,41(9):329-338.
4曹春萍,李哲.基于ResNet101多特征融合的新型冠状病毒感染图像分类方法[J].小型微型计算机系统,2024,45(10):2473-2478.
5罗娱.多个涵盖VVC标准的专利池的分析与比较[J].中国标准化,2024(18):46-50.
6钟辉,陆宇,殷海兵,黄晓峰.一种基于编码单元快速划分的VVC帧内编码方法[J].电信科学,2024,40(8):23-33.
7肖鑫.“三分类”新规下的信托公司风险管理[J].银行家,2024(9):110-116.
8刘晓亮,王志华,杨晓梅,程维明,张俊瑶,刘岳明,刘彬,孟丹,曾晓伟.面向自然场景土地覆被分类的遥感物候模式分区[J].地理学报,2024,79(9):2206-2229.
9杨刚,陈秋宇.基于Landsat-8的天山北坡经济带棉花种植面积提取[J].农业灾害研究,2024,14(8):40-42.
10王晨晨,翟明灿,李贺,莫小明,查志华,吴杰.基于可见/近红外透射光谱的亚健康水心苹果检测[J].食品与机械,2024,40(7):117-125.

电子与信息学报

2024年第9期

浏览历史

内容加载中请稍等...

一种快速的多尺度多输入编码树单元互补分类网络

参考文献1

二级参考文献3

共引文献6

相关作者

相关机构

相关主题

浏览历史