期刊文献+
共找到256篇文章
< 1 2 13 >
每页显示 20 50 100
基于注意力机制的多用户全景视频视口预测 被引量:1
1
作者 张汉琦 黄聪宇 +2 位作者 王晶 李知禹 杨立东 《信号处理》 北大核心 2025年第2期302-311,共10页
近年来,随着虚拟现实等沉浸式技术的发展,全景视频技术的应用前景也在逐步扩展。全景视频提供了逼真的沉浸式体验,但同时也给网络带宽带来了极大的传输压力。因此,如何降低其传输带宽成为了研究的焦点,视口预测则是该领域的研究热点。当... 近年来,随着虚拟现实等沉浸式技术的发展,全景视频技术的应用前景也在逐步扩展。全景视频提供了逼真的沉浸式体验,但同时也给网络带宽带来了极大的传输压力。因此,如何降低其传输带宽成为了研究的焦点,视口预测则是该领域的研究热点。当前,主流的视口预测方案多是利用观看者的视点轨迹和画面内容,结合神经网络输出结果,并进行评估。现有的方法大多不能在长时间预测取得较好的效果,且没有充分利用多用户场景下的数据。为此,本文借鉴了目前流行的Transformer网络中的注意力机制,提出了一种在多用户场景下预测未来较长时间视口的方案。由于不同用户在观看同一视频的视点轨迹具有相似性,本文首先提出了一种多用户视口轨迹相似性比较方案,该方案利用目标用户的视口轨迹数据和历史用户的视口轨迹数据预测目标用户未来视口轨迹数据。其次,由于全景视频视口轨迹存在着不连续性,本文对不连续视口轨迹进行映射处理来解决单次预测轨迹数据不连续的问题,在实验中使用此方法处理数据集的效果较好。最后,本文通过实验对比了两个近年提出的具有相似输出的模型,结果显示本文提出的全景视频预测算法在平均绝对误差、曼哈顿距离以及本文提出的角度距离误差指标下有所减少,部分指标减少超过10%。这说明本文提出的方案能在较长时间视口预测取得更高的精度,引入注意力机制和多用户相似性比较有助于提升模型性能和泛化能力。 展开更多
关键词 全景视频 虚拟现实 视口预测 显著图 注意力机制 神经网络
在线阅读 下载PDF
可量测全景视频流在胡同实景三维建设中的应用
2
作者 刘凤珠 赵亚丽 +2 位作者 马新建 曹明亮 毛明楷 《北京测绘》 2025年第1期40-47,共8页
北京首都功能核心区的传统胡同狭窄且空间分布广,通过精细三维重建方式实现胡同实景三维建设的成本极高,在航飞受限的情况下可采用新的地理空间表达方式——可量测全景视频流来获取立体化、可视化、可量测的胡同全景视频流数据。可量测... 北京首都功能核心区的传统胡同狭窄且空间分布广,通过精细三维重建方式实现胡同实景三维建设的成本极高,在航飞受限的情况下可采用新的地理空间表达方式——可量测全景视频流来获取立体化、可视化、可量测的胡同全景视频流数据。可量测全景视频流集成了视频和地理信息的双重优势,具有可视化、可量测、时空信息丰富的特点。本研究针对核心区500余条胡同,通过优化车载激光测量系统、研究大范围胡同区域的视频流数据采集和处理路线,形成胡同可量测全景视频流地理数据,结合中轴线申遗项目中对于传统胡同风貌监测的需求,提取胡同不协调风貌兴趣点(POI),探索了基于视频流数据的胡同风貌监测应用。总体上,本研究实现了全景视频流的胡同实景三维建设,助力了中轴线申遗项目中传统胡同风貌监测的地理信息数据采集工作,提供了全景视频流的时空信息服务经验,扩展了实景三维的应用。 展开更多
关键词 全景视频 可量测 可视化 胡同 首都功能核心区 实景三维
在线阅读 下载PDF
全景视频基于块的视口自适应传输方案综述
3
作者 李俊杰 望育梅 +1 位作者 李志军 刘雨 《计算机应用》 CSCD 北大核心 2024年第2期536-547,共12页
全景视频由于独特的沉浸式、交互式体验受到广泛关注。全景视频传输所需的高带宽、低时延给现有网络传输系统带来了挑战。基于tile(块)的视口自适应传输可以有效缓解全景视频所带来的传输压力,成为当前的主流方案和研究热点。通过分析基... 全景视频由于独特的沉浸式、交互式体验受到广泛关注。全景视频传输所需的高带宽、低时延给现有网络传输系统带来了挑战。基于tile(块)的视口自适应传输可以有效缓解全景视频所带来的传输压力,成为当前的主流方案和研究热点。通过分析基于tile的视口自适应传输方案的研究现状和发展趋势,对该传输方案的两个重要模块,即视口预测与码率分配进行论述,从不同视角归纳总结相关领域的方法。首先,基于全景视频传输框架对相关技术进行阐明;其次,从主、客观两个维度分别介绍评估传输系统性能的用户体验质量的指标;再后,分别从视口预测、码率分配两方面进行归纳,系统梳理经典的研究方法;最后,基于当前研究现状讨论全景视频传输的未来发展趋势。 展开更多
关键词 全景视频 视口自适应传输 视口预测 码率分配 用户体验质量
在线阅读 下载PDF
ERP全景视频VVC帧内编码CU快速划分算法
4
作者 李强 董阳 赵宇 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第5期1004-1014,共11页
针对等矩柱状投影(equirectangular projection,ERP)全景视频多功能视频编码(versatile video coding,VVC)帧内编码复杂度过高的问题,提出一种编码单元(coding unit,CU)快速划分算法。根据ERP采样特性,将编码帧分为不同纬度区域。基于... 针对等矩柱状投影(equirectangular projection,ERP)全景视频多功能视频编码(versatile video coding,VVC)帧内编码复杂度过高的问题,提出一种编码单元(coding unit,CU)快速划分算法。根据ERP采样特性,将编码帧分为不同纬度区域。基于不同纬度区域CU四叉树深度的分布特性和相邻CU的相关性,对当前CU的划分模式进行提前终止决策;利用梯度差异评估当前CU纹理特性,跳过冗余的水平或垂直划分模式。针对纹理模糊CU,通过纬度采样权重加权的二次比较,判断是否跳过垂直划分模式;利用二维哈尔小波变换系数评估当前CU子块间的差异,判断是否跳过三叉树划分模式。实验结果表明,在全帧内模式下,与VVC官方测试平台相比,所提算法能节省43.85%的编码时间,码率仅增加0.85%,视频质量没有明显下降。 展开更多
关键词 ERP全景视频 CU划分 纹理特征 子块差异
在线阅读 下载PDF
面向360°全景视频的帧内预测编码的快速算法
5
作者 金雪松 王田田 《无线电工程》 2024年第5期1074-1082,共9页
为了节省360°全景视频的编码时间,对通用视频编码标准中的编码单元划分决策过程进行了研究,提出了一种面向360°全景视频的帧内预测编码的快速算法。通过优化编码树单元(Coding Tree Unit,CTU)的编码深度范围和编码单元的划分... 为了节省360°全景视频的编码时间,对通用视频编码标准中的编码单元划分决策过程进行了研究,提出了一种面向360°全景视频的帧内预测编码的快速算法。通过优化编码树单元(Coding Tree Unit,CTU)的编码深度范围和编码单元的划分模式的选择过程,减少编码时间。实验结果表明,在全帧内模式下,所提算法比原始算法平均可以节省34.33%的时间复杂度,同时带来的BDBR平均增量仅为1.665%,BDPSNR的平均降低量仅为0.076 dB。 展开更多
关键词 通用视频编码 360°全景视频 帧内编码 快速算法
在线阅读 下载PDF
基于视觉感知的立体全景视频高效编码
6
作者 杜宝祯 陈龙 《数字技术与应用》 2024年第4期208-211,共4页
针对全景视频编码过程中码率过高的问题,本文提出了基于感知阈值的立体全景视频感知编码算法。首先基于空域恰可失真模型和全景维度因子,得到全景空域感知因子;然后基于视频时域恰可感知失真模型,得到视频时域感知因子,用于表征运动特... 针对全景视频编码过程中码率过高的问题,本文提出了基于感知阈值的立体全景视频感知编码算法。首先基于空域恰可失真模型和全景维度因子,得到全景空域感知因子;然后基于视频时域恰可感知失真模型,得到视频时域感知因子,用于表征运动特性。在上述研究基础上,对立体感知量化参数阈值模型进行优化,最终提出了基于视觉感知阈值的立体全景视频编码方案。实验表明,所提出的算法能有效节省编码码率,且率失真性能良好。 展开更多
关键词 视频编码 视觉感知 感知因子 量化参数 失真模型 编码过程 全景视频 码率
在线阅读 下载PDF
全景视频中多运动对象检测与跟踪方法
7
作者 刘慧彤 王希 +1 位作者 刘威 杨鹏 《计算机工程与应用》 CSCD 北大核心 2024年第10期188-197,共10页
全景视频多运动对象检测与跟踪技术的通用解决方案是通过投影变换将360°视频转为二维视频后进行检测和跟踪。然而固定球面投影变换会导致全景视频中存在空间上不连续的投影边界,当运动对象处于投影边界时,常规球面投影方法可能将... 全景视频多运动对象检测与跟踪技术的通用解决方案是通过投影变换将360°视频转为二维视频后进行检测和跟踪。然而固定球面投影变换会导致全景视频中存在空间上不连续的投影边界,当运动对象处于投影边界时,常规球面投影方法可能将其切分为多个部分,从而导致该运动对象的漏检或误检。针对该问题,提出了融合等距柱状形投影(equi-rectangular projection,ERP)和立方体投影(cube map projection,CMP)的全景视频多运动对象检测与跟踪方法,利用合适的CMP拼接帧减少ERP两极区域失真并弥补其边界不连续性,解决了处于投影边界和两极扭曲的对象检测问题。进一步,通过感知哈希、球面质心和运动方向等多重特征融合来解决全景视频多运动对象跟踪问题。实验结果表明,提出的方案可以有效减少投影边界不连续导致的误检,且能有效应对遮挡、穿梭帧边界和两极扭曲的对象跟踪问题。 展开更多
关键词 全景视频 多运动对象检测与跟踪 等距柱状形投影(ERP) 立方体投影(CMP)
在线阅读 下载PDF
交互式全景视频技术在烟草专卖市场检查培训中的应用探析
8
作者 张劲辉 张志业 +3 位作者 季法珍 梁海祥 李森 陈正铭 《电脑知识与技术》 2024年第4期118-121,共4页
目前企业一般采用集中式线下培训或者分散式线上观看培训视频方式进行业务培训,难以获得良好效果。采用交互式全景视频技术制作企业的业务培训虚拟现实软件,可提供受训人真实的沉浸式的学习情景,增强培训效果。文章以烟草专卖市场检查... 目前企业一般采用集中式线下培训或者分散式线上观看培训视频方式进行业务培训,难以获得良好效果。采用交互式全景视频技术制作企业的业务培训虚拟现实软件,可提供受训人真实的沉浸式的学习情景,增强培训效果。文章以烟草专卖市场检查培训为案例介绍了软件流程脚本设计、全景视频的拍摄、拼接和交互式设计的关键技术,为虚拟现实技术在教育培训领域的应用提供了借鉴与思路。 展开更多
关键词 虚拟现实 交互 全景视频 培训 烟草专卖
在线阅读 下载PDF
一种360°全景视频自适应FEC编码算法研究
9
作者 周简心 高廷金 张森林 《电视技术》 2024年第3期19-22,30,共5页
针对全景视频数据因量大和延时敏感的特点造成的视频失真问题,提出一种360°全景视频自适应前向纠错(Forward Error Correction,FEC)编码算法,根据实时网络状况对全景视频的图块进行编码比特率和FEC编码率的优化匹配,将全景视频传... 针对全景视频数据因量大和延时敏感的特点造成的视频失真问题,提出一种360°全景视频自适应前向纠错(Forward Error Correction,FEC)编码算法,根据实时网络状况对全景视频的图块进行编码比特率和FEC编码率的优化匹配,将全景视频传输质量最大化,减少视频失真。实验结果证明,与传统视频传输算法相比,该算法可以减少视频失真,且视频峰值信噪比(Peak Signal to Noise Ratio,PSNR)提高5~7 dB。 展开更多
关键词 全景视频 前向纠错(FEC) 视频传输
在线阅读 下载PDF
基于全景视频源的人工智能取景系统的研究与应用
10
作者 谢海涛 白绍元 +1 位作者 唐骏权 黄伟 《现代电视技术》 2024年第5期66-70,共5页
本文介绍了基于全景视频源的人工智能取景系统的设计理念和系统架构,重点阐述了基于全景视频的对象识别方法的应用与实现,对系统采用的自动构图技术以及自动构图模块的设计方案进行了说明,阐述了系统完成的功能开发,并展望了系统的可扩... 本文介绍了基于全景视频源的人工智能取景系统的设计理念和系统架构,重点阐述了基于全景视频的对象识别方法的应用与实现,对系统采用的自动构图技术以及自动构图模块的设计方案进行了说明,阐述了系统完成的功能开发,并展望了系统的可扩展功能和未来研究方向。 展开更多
关键词 全景视频 人工智能取景 对象识别 自动构图 8K超高清
在线阅读 下载PDF
一种小型运动空间内的VR全景视频拍摄系统组建与摄制 被引量:1
11
作者 孟川杰 彭雪婷 《通信与信息技术》 2019年第2期55-57,共3页
VR全景视频需求不断增长,但还未形成成熟的设备系统和类似传统影视的成熟语言体系,针对这个问题,通过对某汽车VR全景视频拍摄项目的分析,结合拍摄需求和工作场景,选择了适当的拍摄设备,设计了拍摄内容和后期制作流程。在项目实施过程中... VR全景视频需求不断增长,但还未形成成熟的设备系统和类似传统影视的成熟语言体系,针对这个问题,通过对某汽车VR全景视频拍摄项目的分析,结合拍摄需求和工作场景,选择了适当的拍摄设备,设计了拍摄内容和后期制作流程。在项目实施过程中,归纳了VR全景视频与传统视频在拍摄设备、拍摄手法、后期制作及应用上的差异,并就拍摄与制作过程中遇到的问题进行了探讨。 展开更多
关键词 虚拟现实 全景视频 全景拍摄设备 全景视频后期
在线阅读 下载PDF
GPU协同处理在全景视频生成系统中的应用 被引量:3
12
作者 彭勃 张磊 王广生 《国外电子测量技术》 2009年第5期78-82,共5页
为了解决全景视频生成系统中的速度瓶颈,讨论了一种基于显卡硬件加速的全景视频生成方法,该方法将显卡中的图形处理器(graphic processing unit,GPU)作为CPU的协处理器,充分发挥GPU强大的图形处理能力,协助CPU处理那些运算量巨大的图像... 为了解决全景视频生成系统中的速度瓶颈,讨论了一种基于显卡硬件加速的全景视频生成方法,该方法将显卡中的图形处理器(graphic processing unit,GPU)作为CPU的协处理器,充分发挥GPU强大的图形处理能力,协助CPU处理那些运算量巨大的图像处理任务,如白平衡和透视变换处理等,从而将CPU从繁重的图像处理工作中解放出来,并在很大程度上提高全景视频的生成效率,使之达到实时的生成效果。这一GPU协同处理的全景视频生成架构已在一台全景摄像机系统样机上实现,并能够实时地生成360°的全景视频,表明该全景视频生成架构在工程上具有可行性。 展开更多
关键词 全景视频 图形处理器 GPU通用计算 全景视频生成架构
在线阅读 下载PDF
采用视频拼图方法构建高分辨率全景视频监控系统 被引量:13
13
作者 马力 张茂军 +2 位作者 徐玮 熊志辉 王瑜 《中国图象图形学报》 CSCD 北大核心 2008年第12期2291-2296,共6页
与普通视频监控系统只能实现单向监控不同,全景视频监控系统可以实现360°全向监控。设计并实现了一种嵌入式高分辨率全景视频监控系统KD-PVS。重点介绍了KD-PVS中多个摄像头的空间位置设计、视频图像变换与拼接算法。KD-PVS通过对... 与普通视频监控系统只能实现单向监控不同,全景视频监控系统可以实现360°全向监控。设计并实现了一种嵌入式高分辨率全景视频监控系统KD-PVS。重点介绍了KD-PVS中多个摄像头的空间位置设计、视频图像变换与拼接算法。KD-PVS通过对多个摄像头采集的视频进行实时变换与拼接以生成全景视频。该系统可方便应用于金融系统、仓库、监狱和移动监控等多种场合,尤其适用于室内监控。 展开更多
关键词 全景视频 嵌入式系统 视频拼图 视频监控
在线阅读 下载PDF
一种基于CAVE的交互式全景视频显示方法 被引量:10
14
作者 权巍 范静涛 +2 位作者 蒋振刚 韩成 陈纯毅 《微电子学与计算机》 CSCD 北大核心 2012年第5期134-137,共4页
为了实现全景视频的沉浸式显示,开发了一个基于CAVE的交互式全景视频显示系统.本系统成功地实现了pgr全景视频文件在CAVE上的播放.首先,将全景视频中的每一帧全景图像映射到一个虚拟球面上;其次,使用五个虚拟相机对该球面的四面及顶面... 为了实现全景视频的沉浸式显示,开发了一个基于CAVE的交互式全景视频显示系统.本系统成功地实现了pgr全景视频文件在CAVE上的播放.首先,将全景视频中的每一帧全景图像映射到一个虚拟球面上;其次,使用五个虚拟相机对该球面的四面及顶面进行拍摄,调整各相机的参数使所得各幅图像覆盖整个球面区域,并能够无缝拼接;最后,将所得五幅图像分别投影到CAVE系统中各投影幕中;另外,实现通过鼠标、手柄等输入设备调整CAVE中各投影幕的画面. 展开更多
关键词 全景图像 全景视频显示 多投影 CAVE
在线阅读 下载PDF
全景视频信息空间模型 被引量:12
15
作者 钟力 胡晓峰 孙立峰 《小型微型计算机系统》 EI CSCD 北大核心 1997年第11期31-35,共5页
全景视频是一种以360度实景全景图像为基础来构造虚拟环境的技术,本文讨论了利用它来建立一个可操作、可漫游的虚拟信息空间,并就如何建立该空间模型进行了研究。该空间具有立体显示和三维虚拟声音,能够组织、存取、操作和表现多... 全景视频是一种以360度实景全景图像为基础来构造虚拟环境的技术,本文讨论了利用它来建立一个可操作、可漫游的虚拟信息空间,并就如何建立该空间模型进行了研究。该空间具有立体显示和三维虚拟声音,能够组织、存取、操作和表现多媒体空间数据。 展开更多
关键词 全景视频 空间模型 信息组织 虚拟现实
在线阅读 下载PDF
基于四拼图的嵌入式全景视频实时生成系统 被引量:4
16
作者 陈立栋 徐玮 +2 位作者 张茂军 熊志辉 马力 《信号处理》 CSCD 北大核心 2009年第12期1946-1950,共5页
为实现360度全方向视频监控,本文设计了一个正四棱台形视频采集固定装置,对四个广角摄像头采集的局部视频进行实时的畸变校正、柱面投影变换和全景拼接来生成全景视频。系统以TMS320DM642为开发平台,基于查找表技术提出了一种"分... 为实现360度全方向视频监控,本文设计了一个正四棱台形视频采集固定装置,对四个广角摄像头采集的局部视频进行实时的畸变校正、柱面投影变换和全景拼接来生成全景视频。系统以TMS320DM642为开发平台,基于查找表技术提出了一种"分块预取"策略,并针对DSP的并行和流水特点,采用双缓冲数据访问机制、高并行度算法设计等,实时生成130万象素的柱面全景视频,帧速率达36fps。 展开更多
关键词 四路视频拼接 柱面全景视频 分块预取 双缓冲 流水线
在线阅读 下载PDF
基于全景视频的虚拟地理环境建模技术研究 被引量:6
17
作者 李科 熊自明 杜琳 《系统仿真学报》 CAS CSCD 北大核心 2013年第8期1871-1875,共5页
随着视频、全景图像在各行业领域中广泛使用,目前均已成为虚拟地理环境的重要数据源。探索了基于无人飞行器的全景视频数据快速建模技术,实现了低空全景视频数据与地理空间数据相融合,形成具有严格地理空间数学基础的、新的虚拟地理环... 随着视频、全景图像在各行业领域中广泛使用,目前均已成为虚拟地理环境的重要数据源。探索了基于无人飞行器的全景视频数据快速建模技术,实现了低空全景视频数据与地理空间数据相融合,形成具有严格地理空间数学基础的、新的虚拟地理环境数据模型。该模型可为虚拟地理环境可视化的逼真度和实时表现能力提供有效的理论和技术支撑。 展开更多
关键词 全景 全景视频 视频地理信息系统 虚拟地理环境
在线阅读 下载PDF
全景视频的信息组织和实现方法 被引量:13
18
作者 钟力 胡晓峰 《小型微型计算机系统》 CSCD 北大核心 1996年第12期1-5,共5页
全景视频不是一般意义的虚拟现实,它提供了一种新型的时空信息组织形式。这种基于实景图像的全景视频,具有广阔的应、用前景和研究价值.本文介绍了全景视频的概念和表现方式,以及利用全景视频技术来构造虚拟现实环境的方法,并提出... 全景视频不是一般意义的虚拟现实,它提供了一种新型的时空信息组织形式。这种基于实景图像的全景视频,具有广阔的应、用前景和研究价值.本文介绍了全景视频的概念和表现方式,以及利用全景视频技术来构造虚拟现实环境的方法,并提出了实现全景视频的具体方法步骤。 展开更多
关键词 全景视频 信息组织 虚拟现实
在线阅读 下载PDF
基于全景视频的空间认知效果实验研究 被引量:9
19
作者 钟正 陈卫东 +3 位作者 周东波 张月 薛飞跃 葛婉茹 《电化教育研究》 CSSCI 北大核心 2018年第12期78-84,101,共8页
VR全景视频是近几年新兴的视频类型和学习资源,其学习方式主要包括两种,即直接观看和使用头戴式显示器观看,但两种方式的学习效果是否存在差异以及各自的优缺点是什么亟待人们的探索。VR全景视频能够呈现出360度全景画面,具有虚拟现实... VR全景视频是近几年新兴的视频类型和学习资源,其学习方式主要包括两种,即直接观看和使用头戴式显示器观看,但两种方式的学习效果是否存在差异以及各自的优缺点是什么亟待人们的探索。VR全景视频能够呈现出360度全景画面,具有虚拟现实的沉浸性、交互性和构想性特点,对于情境化学习、空间认知学习、虚拟学习环境构建等具有重要的意义。以空间认知学习为例,对基于全景视频的教育实验进行了等组实验设计,直接学习组与使用头戴式显示器学习组分别选择了30名在校生作为被试,实验数据测量分两个阶段:在观看全景视频的学习过程中进行空间认知的测量,学习完成后进行知识掌握、学习心理感受以及认知负荷的测量。实验研究结果表明:两种学习方式在空间认知、学习心理感受上具有显著性差异,而在知识掌握、认知负荷方面不存在显著性差异。 展开更多
关键词 全景视频 空间认知 效果 实验研究
在线阅读 下载PDF
基于DSP的全景视频多目标实时检测 被引量:2
20
作者 朱威 韩巨峰 +1 位作者 郑雅羽 汤一平 《光电工程》 CAS CSCD 北大核心 2014年第5期68-76,共9页
全景视频由于具有360?的视角,非常适合用于智能视频监控中的多目标检测。首先介绍了以DSP处理器为核心的系统处理平台;接着介绍了全景图像的展开算法和MHOEI多目标检测算法;然后针对全景展开设计了适合DSP平台的分块查表展开方法,针对MH... 全景视频由于具有360?的视角,非常适合用于智能视频监控中的多目标检测。首先介绍了以DSP处理器为核心的系统处理平台;接着介绍了全景图像的展开算法和MHOEI多目标检测算法;然后针对全景展开设计了适合DSP平台的分块查表展开方法,针对MHOEI设计了降分辨率处理方法;最后在DSP处理器上进行了优化实现。实验表明,在所选的DM6437处理器上,将720×576大小的全景图像展开为896×180大小的目标图像,展开帧率可达120帧每秒;再经过多目标检测后能达到平均35帧每秒,满足实时要求,同时能有效检测出全景视频中的运动和静止目标。 展开更多
关键词 全景视频 多目标检测 DSP MHOEI
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部