期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
JPEG2000小波变换器的VLSI结构设计 被引量:5
1
作者 刘雷波 王学进 +3 位作者 孟鸿鹰 王志华 陈弘毅 夏宇闻 《电子学报》 EI CAS CSCD 北大核心 2002年第11期1609-1612,共4页
新一代静止图像压缩标准JPEG2 0 0 0将离散小波变换 (DWT)作为其核心变换技术 ,并推荐采用推举体制 (lifting)快速算法来实现 .空间组合推举体制算法 (SCLA)大大降低了lifting的运算量 .当选用 9/ 7小波滤波器时 ,SCLA的乘法运算量只有l... 新一代静止图像压缩标准JPEG2 0 0 0将离散小波变换 (DWT)作为其核心变换技术 ,并推荐采用推举体制 (lifting)快速算法来实现 .空间组合推举体制算法 (SCLA)大大降低了lifting的运算量 .当选用 9/ 7小波滤波器时 ,SCLA的乘法运算量只有lifting的 7/ 12 .本文提出了一种实现SCLA算法的VLSI结构 ,降低了基于lifting实现的运算量 ,加快了变换的速度 ,减小了电路的规模 .本文的二维正反小波变换器已经作为单独的IP核应用于我们目前正在开发的JPEG2 0 0 展开更多
关键词 JPEG2000 小波变换器 VLSI结构设计 LIFTING 空间组合推举体制算法 图像压缩
在线阅读 下载PDF
JPEG2000 EBCOT编码器的VLSI结构设计 被引量:1
2
作者 刘雷波 李德建 +4 位作者 孟鸿鹰 张利 王志华 陈弘毅 夏宇闻 《北京邮电大学学报》 EI CAS CSCD 北大核心 2003年第4期61-65,共5页
采用并行运算和动态内存控制DMC(dynamicmemorycontrol)的结构完成了EBCOT(em-beddedblockcodingwithoptimizedtruncation)编码器的VLSI设计.在保证编码速度的前提下,最大限度降低了片内存储器的访问频率,同时将片内小波系数缓存量减少... 采用并行运算和动态内存控制DMC(dynamicmemorycontrol)的结构完成了EBCOT(em-beddedblockcodingwithoptimizedtruncation)编码器的VLSI设计.在保证编码速度的前提下,最大限度降低了片内存储器的访问频率,同时将片内小波系数缓存量减少了60%以上.在200MHz的工作主频下,每秒可以完成20帧分辨率为1024×1024×24比特图像的JPEG2000编码.该E-BCOT编码器已经作为单独的IP核应用于目前正在开发的JPEG2000图像编解码芯片中. 展开更多
关键词 JPEG2000 EBCOT编码器 VLSI结构设计 动态内存控制 图像压缩
在线阅读 下载PDF
嵌入式粗颗粒度可重构处理器的软硬件协同设计流程 被引量:11
3
作者 于苏东 刘雷波 +1 位作者 尹首一 魏少军 《电子学报》 EI CAS CSCD 北大核心 2009年第5期1136-1140,共5页
面向多媒体应用的可重构处理器架构由主处理器和动态配置的可重构阵列(Reconfigurable Cell Array,RCA)组成.协同设计流程以循环流水线和流水线配置技术为基础,采用启发式算法对应用中较大的关键循环进行了软硬件划分,使用表格调度算法... 面向多媒体应用的可重构处理器架构由主处理器和动态配置的可重构阵列(Reconfigurable Cell Array,RCA)组成.协同设计流程以循环流水线和流水线配置技术为基础,采用启发式算法对应用中较大的关键循环进行了软硬件划分,使用表格调度算法实现了任务在RCA上的映射.经过FPGA验证,H.264基准中的核心算法平均执行速度相比于PipeRench,MorphoSys,以及TI DSP TMS320C64X提高了3.34倍. 展开更多
关键词 可重构 循环 软硬件划分 映射
在线阅读 下载PDF
面向对称密码领域的可重构阵列设计 被引量:5
4
作者 朱敏 刘雷波 +2 位作者 尹首一 陈英杰 魏少军 《微电子学》 CAS CSCD 北大核心 2012年第6期815-818,共4页
通过研究密码系统的特点,提出一种面向对称密码领域的可重构阵列结构。该阵列普遍适用于分组密码和流密码系统,灵活性高。通过配置信息的更新,可以快速动态切换加密功能,切换时间小于20ns。该结构包含几个16×16的比特阵列和8×... 通过研究密码系统的特点,提出一种面向对称密码领域的可重构阵列结构。该阵列普遍适用于分组密码和流密码系统,灵活性高。通过配置信息的更新,可以快速动态切换加密功能,切换时间小于20ns。该结构包含几个16×16的比特阵列和8×8的字节阵列,AES算法实现分组密码的加密速率为640Mb/s~2.56Gb/s,DES算法为1.6Gb/s~3.2Gb/s,SMS4算法为318Mb/s~1.6Gb/s,流密码Geffe的加密速率为400Mb/s。与文献[1]~[3]相比,SMS4算法的性能有接近2倍的提升。 展开更多
关键词 可重构计算 对称密码 AES DES
在线阅读 下载PDF
为CPU芯片的硬件安全保驾护航
5
作者 刘雷波 《中国科技财富》 2019年第10期85-85,共1页
如何确保CPU芯片的硬件安全,是学术界和产业界一直面临但尚未解决的国际公认难题。清华大学硬件安全与密码芯片实验室团队提出了基于高安全、高灵活可重构芯片架构的“CPU硬件安全动态监测管控(DSC)技术”,可有效应对CPU硬件漏洞威胁,... 如何确保CPU芯片的硬件安全,是学术界和产业界一直面临但尚未解决的国际公认难题。清华大学硬件安全与密码芯片实验室团队提出了基于高安全、高灵活可重构芯片架构的“CPU硬件安全动态监测管控(DSC)技术”,可有效应对CPU硬件漏洞威胁,首次实现了芯片内第三方硅监控的CPU硬件安全解决方案,大幅提升CPU芯片的硬件安全性。 展开更多
关键词 硬件安全 CPU芯片 密码芯片 安全解决方案 可重构 实验室 漏洞 第三方
在线阅读 下载PDF
新型智能存储SoC中NAND Flash控制器的软/硬件设计 被引量:5
6
作者 韩睦华 支军 +1 位作者 刘雷波 魏少军 《微电子学》 CAS CSCD 北大核心 2009年第2期185-189,共5页
介绍了新一代智能存储片上系统SSC,详细讨论了SSC中NAND Flash子系统的软/硬件设计;采用基于模板的划分方法,实现NAND读写控制器的软/硬件划分。SSC已生产并通过工业测试。结果表明,采用软/硬件划分的方法,NAND控制器的面积比纯硬件的... 介绍了新一代智能存储片上系统SSC,详细讨论了SSC中NAND Flash子系统的软/硬件设计;采用基于模板的划分方法,实现NAND读写控制器的软/硬件划分。SSC已生产并通过工业测试。结果表明,采用软/硬件划分的方法,NAND控制器的面积比纯硬件的实现方法减小58%,性能仅下降16%;比单纯ARM软件实现,速度平均提高20倍,同时具有软件的高灵活性。 展开更多
关键词 智能存储 片上系统 NAND FLASH控制器 软/硬件协同设计
在线阅读 下载PDF
基于循环映射的可重构处理器设计 被引量:6
7
作者 于苏东 刘雷波 魏少军 《北京邮电大学学报》 EI CAS CSCD 北大核心 2009年第4期10-14,共5页
提出了一种适合循环任务执行的可重构处理器.该处理器通过循环控制器实现循环的自动执行,并采用数据分发技术和不对称先进先出缓存(FIFO)技术,将可重构阵列内部数据传输效率提高8倍.在现场可编程门阵列(FPGA)系统上验证了活动图像专家... 提出了一种适合循环任务执行的可重构处理器.该处理器通过循环控制器实现循环的自动执行,并采用数据分发技术和不对称先进先出缓存(FIFO)技术,将可重构阵列内部数据传输效率提高8倍.在现场可编程门阵列(FPGA)系统上验证了活动图像专家组-4的高等视频编码(H.264)中整数反离散余弦变换(IDCT)、运动估计及活动图像专家组-2(MPEG-2)中的IDCT等多种媒体核心算法.相比于类似的结构,该可重构处理器在不增加阵列规模的情况下,性能平均提升3.5倍. 展开更多
关键词 可重构处理器 可重构阵列 循环映射
在线阅读 下载PDF
SoC设计中的时钟低功耗技术 被引量:10
8
作者 王延升 刘雷波 《计算机工程》 CAS CSCD 北大核心 2009年第24期257-258,261,共3页
针对时钟网络在SoC芯片中的作用和时钟网络自身的特点,研究并实现3种时钟低功耗技术,包括在系统级采用动态时钟管理技术动态地关断和配置芯片内各模块的时钟,在逻辑综合时基于功耗优化工具Power Compiler插入门控时钟单元,在时钟树综合... 针对时钟网络在SoC芯片中的作用和时钟网络自身的特点,研究并实现3种时钟低功耗技术,包括在系统级采用动态时钟管理技术动态地关断和配置芯片内各模块的时钟,在逻辑综合时基于功耗优化工具Power Compiler插入门控时钟单元,在时钟树综合时以时钟树规模为目标进行低功耗时钟树综合。在音视频解码芯片的设计中采用以上3种技术,结果表明其功耗优化效果明显。 展开更多
关键词 时钟 动态时钟管理 门控时钟 低功耗时钟树综合
在线阅读 下载PDF
基于JPEG2000编解码芯片的高清晰数字图像监控系统 被引量:2
9
作者 赵伟 刘雷波 +2 位作者 张利 王志华 谢时根 《微电子学与计算机》 CSCD 北大核心 2005年第6期113-115,119,共4页
基于JPEG2000图像编解码芯片(型号:THUJ2K01),设计了包括图像采集、压缩、传输、存储显示及系统控制的高清晰数字图像监控系统,并就涉及的关键技术和实现方法进行了讨论。控制软件部分采用多线程程序设计技术,结果表明多线程有效地改善... 基于JPEG2000图像编解码芯片(型号:THUJ2K01),设计了包括图像采集、压缩、传输、存储显示及系统控制的高清晰数字图像监控系统,并就涉及的关键技术和实现方法进行了讨论。控制软件部分采用多线程程序设计技术,结果表明多线程有效地改善了系统资源的利用,图像处理速度达到单线程时的两倍。 展开更多
关键词 JPEG2000 高清晰 图像监控 多线程 以太网
在线阅读 下载PDF
TANGRAM:一个基于比特切片的适合多平台的分组密码 被引量:6
10
作者 张文涛 季福磊 +5 位作者 丁天佑 杨博翰 赵雪锋 向泽军 包珍珍 刘雷波 《密码学报》 CSCD 2019年第6期727-747,共21页
本文提出一族新的分组密码算法TANGRAM.TANGRAM包含三个版本:TANGRAM128/128,分组长度和密钥长度均为128比特;TANGRAM 128/256,分组长度为128比特,密钥长度为256比特;TANGRAM 256/256,分组长度和密钥长度均为256比特.TANGRAM分组密码采... 本文提出一族新的分组密码算法TANGRAM.TANGRAM包含三个版本:TANGRAM128/128,分组长度和密钥长度均为128比特;TANGRAM 128/256,分组长度为128比特,密钥长度为256比特;TANGRAM 256/256,分组长度和密钥长度均为256比特.TANGRAM分组密码采用SP网络,我们对其S盒的选取以及线性层移位参数的选取进行了深入研究,以使TANGRAM尽可能达到最优的安全性和实现性能的性价比.我们深入分析了TANGRAM针对差分、线性、不可能差分、积分、相关密钥等重要密码分析方法的安全性,为它预留了足够的安全冗余.得益于比特切片方法,TANGRAM在多种软件和硬件平台上都具有很好的表现,可以灵活地适用于多种应用场景. 展开更多
关键词 分组密码 比特切片方法 安全性分析 软件实现 硬件实现 侧信道防护
在线阅读 下载PDF
基于THJ2K的JPEG2000图像压缩系统 被引量:5
11
作者 陈柠檬 刘雷波 张利 《电视技术》 北大核心 2007年第6期81-84,共4页
介绍了由清华大学研发的JPEG2000编码芯片THJ2K的功能和工作原理,在正常工作频率下(100MHz),该芯片每秒可完成20帧分辨率为512×512×8 bit图像的压缩,而基于THJ2K设计的JPEG2000图像压缩系统,每秒可完成11.75帧分辨率为1 024&#... 介绍了由清华大学研发的JPEG2000编码芯片THJ2K的功能和工作原理,在正常工作频率下(100MHz),该芯片每秒可完成20帧分辨率为512×512×8 bit图像的压缩,而基于THJ2K设计的JPEG2000图像压缩系统,每秒可完成11.75帧分辨率为1 024×1 024×8 bit图像的压缩。 展开更多
关键词 JPEG2000标准 图像压缩 专用集成电路
在线阅读 下载PDF
基于相似结构自动提取的SoC划分方法 被引量:3
12
作者 韩睦华 刘雷波 魏少军 《计算机工程》 CAS CSCD 北大核心 2010年第1期4-6,14,共4页
提取应用描述中的相似运算结构并使用相似结构划分系统可以有效实现片上系统划分。提出一种基于生长的相似结构自动提取方法,其中的单模板匹配算法实现任意结构模板的提取,多模板生成算法采用模板和子图同步生长的方法。实验结果表明,... 提取应用描述中的相似运算结构并使用相似结构划分系统可以有效实现片上系统划分。提出一种基于生长的相似结构自动提取方法,其中的单模板匹配算法实现任意结构模板的提取,多模板生成算法采用模板和子图同步生长的方法。实验结果表明,该方法适用于包含扇出和汇聚结构的模板提取,计算时间与传统方法相比可减少30%~70%。 展开更多
关键词 片上系统 划分 相似性
在线阅读 下载PDF
关键循环到可重构阵列映射中的时序参数分析 被引量:1
13
作者 朱敏 刘雷波 +2 位作者 尹首一 王星 魏少军 《计算机工程》 CAS CSCD 2012年第22期260-262,266,共4页
通过定义算法关键循环到可重构阵列映射的建立时间、保持时间等核心时序参数,分析存储器带宽有限、算法数据流图拓扑不规则等实际问题,给出配置时序模型的优化算法,提出路径特征等参数的描述形式,为可重构自动编译提供新的处理方式。验... 通过定义算法关键循环到可重构阵列映射的建立时间、保持时间等核心时序参数,分析存储器带宽有限、算法数据流图拓扑不规则等实际问题,给出配置时序模型的优化算法,提出路径特征等参数的描述形式,为可重构自动编译提供新的处理方式。验证结果表明,在视频算法H.264关键循环deblocking的映射过程中,该优化映射方法使得性能在原有基础上提升43%。 展开更多
关键词 关键循环 可重构阵列 算法映射 时序模型 阵列建立时间 阵列保持时间
在线阅读 下载PDF
一种面向分组密码的粗粒度可重构阵列及AES算法映射 被引量:7
14
作者 郭岩松 刘雷波 《微电子学与计算机》 CSCD 北大核心 2015年第9期1-5,共5页
为了开发具有一定灵活性的高性能低功耗分组密码处理器,提出了一种粗粒度可重构阵列架构BCORE.在对分组密码算法进行分析的基础上,在阵列中集成了必要的功能单元和互连,并可以由称为动态部分可重构的配置控制机制在运行时进行配置.分别... 为了开发具有一定灵活性的高性能低功耗分组密码处理器,提出了一种粗粒度可重构阵列架构BCORE.在对分组密码算法进行分析的基础上,在阵列中集成了必要的功能单元和互连,并可以由称为动态部分可重构的配置控制机制在运行时进行配置.分别用非流水线和流水线方式在可重构阵列上映射了AES算法.在流水线方式时利用了动态部分可重构能力以提高性能.仿真和综合结果表明最高吞吐率接近2.5Gb/s,与其他平台的对比表明粗粒度可重构阵列在实现AES算法时平衡了性能、灵活性和实现效率. 展开更多
关键词 粗粒度可重构阵列 动态部分可重构 算法映射
在线阅读 下载PDF
粗粒度部分动态可重构的人脸检测 被引量:1
15
作者 肖建 刘波 +4 位作者 梅晨 朱敏 杨军 刘雷波 魏少军 《应用科学学报》 EI CAS CSCD 北大核心 2012年第3期299-305,共7页
人脸检测系统应用在嵌入式环境中需满足多种约束,高计算密集性、控制密集性是实时实现困难的主要原因.文中提出一种基于名为"REMUS-Ⅱ"的粗粒度动态可重构架构的人脸检测系统,把层叠型AdaBoost检测算法划分成多个非连续子任务... 人脸检测系统应用在嵌入式环境中需满足多种约束,高计算密集性、控制密集性是实时实现困难的主要原因.文中提出一种基于名为"REMUS-Ⅱ"的粗粒度动态可重构架构的人脸检测系统,把层叠型AdaBoost检测算法划分成多个非连续子任务,通过邮箱通信调度、配置流和数据流优化方法来提高指令级并行度和任务级并行度.实验结果表明,检测分辨率为640×480的图片可获得17帧/s的平均检测速度,正面人脸检测率保持在95%以上.在TSMC 65 nm CMOS工艺、200 MHz工作频率下,REMUS-Ⅱ面积约为24 mm^2,功率约为194 mW. 展开更多
关键词 粗粒度可重构 动态 人脸检测 ADABOOST
在线阅读 下载PDF
基于模板的SoC结构自动划分方法 被引量:2
16
作者 韩睦华 刘雷波 魏少军 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2009年第5期680-687,共8页
针对SoC芯片设计中的系统划分问题,提出一种面向应用的系统结构自动划分方法——基于模板的系统划分方法,并开发了系统划分工具——TBPS.基于模板的系统划分方法通过提取应用描述中的相似结构,并使用相似结构划分系统,最终得到一个尽量... 针对SoC芯片设计中的系统划分问题,提出一种面向应用的系统结构自动划分方法——基于模板的系统划分方法,并开发了系统划分工具——TBPS.基于模板的系统划分方法通过提取应用描述中的相似结构,并使用相似结构划分系统,最终得到一个尽量复用的系统结构.系统的相似结构划分采用遗传算法实现最优覆盖的搜索,并使用贪婪算法实现资源配置和任务调度.与已有的在系统划分中事先设定目标结构方法不同,文中方法可以根据应用的特点自动生成划分的结构.采用该方法及TBPS实现了应用描述到系统结构的自动划分.实验结果表明了TBPS对数据处理为主的应用划分的有效性. 展开更多
关键词 片上系统 划分 遗传算法 相似性
在线阅读 下载PDF
一种CABAC解码引擎的芯片实现 被引量:2
17
作者 朱敏 刘雷波 +3 位作者 王星 殷崇勇 尹首一 魏少军 《电路与系统学报》 北大核心 2013年第2期6-11,共6页
CABAC(Context-based Adaptive Binary Arithmetic coding)是H.264中所采用的一种高效熵编码,压缩率高,但结构复杂,硬件实现难度大。本文在P.Zhang 2008年的工作[1]基础上提出一种单周期CABAC解码引擎的优化实现方法,通过查表替换、分... CABAC(Context-based Adaptive Binary Arithmetic coding)是H.264中所采用的一种高效熵编码,压缩率高,但结构复杂,硬件实现难度大。本文在P.Zhang 2008年的工作[1]基础上提出一种单周期CABAC解码引擎的优化实现方法,通过查表替换、分支预测、逻辑调整、反相器优化等关键路径优化方法和寄存器精简等面积优化方法进一步提高了解码性能。经过芯片验证,CABAC解码引擎性能提高到250Mbps,面积减少46%,峰值工作情形下功耗1.03mW,满足下一代视频编解码协议(QFHD)的需求。 展开更多
关键词 CABAC H 264 单周期CABAC解码引擎
在线阅读 下载PDF
循环在可重构处理器上的软硬件划分技术 被引量:2
18
作者 于苏东 刘雷波 魏少军 《电视技术》 北大核心 2009年第10期21-23,40,共4页
针对较大循环在可重构处理器上的映射问题提出了一种启发式的算法,将循环划分为在处理器上执行的软件部分和在可重构阵列上执行的硬件部分,并且使两者之间的数据传输量最小。通过测试,相比于原有处理较大循环的方法,该技术降低了13%~29... 针对较大循环在可重构处理器上的映射问题提出了一种启发式的算法,将循环划分为在处理器上执行的软件部分和在可重构阵列上执行的硬件部分,并且使两者之间的数据传输量最小。通过测试,相比于原有处理较大循环的方法,该技术降低了13%~29%的循环执行时间。在FPGA验证系统上通过H.264中的运动估计和MPEG-2中的IDCT等多种多媒体核心算法验证了该划分技术。使用该划分技术后,验证系统相比于类似结构在不增加硬件规模的情况下,有平均3.5倍的性能提升。 展开更多
关键词 可重构处理器 可重构阵列 循环映射 软硬件划分
在线阅读 下载PDF
H.264计算密集型任务在可重构处理器上的映射 被引量:1
19
作者 朱敏 刘雷波 +3 位作者 尹首一 杨晨 王文杰 魏少军 《电路与系统学报》 北大核心 2013年第2期366-370,共5页
可重构系统具有领域内灵活,性能和专用电路接近的优点,是视频解码的优秀硬件方案。然而在可重构系统上进行高清实时解码还有一定的难度,其中占80%计算量的主要是IDCT(反离散余弦变换)、MC(运动补偿)、Intra-prediction(帧内预测)、deblo... 可重构系统具有领域内灵活,性能和专用电路接近的优点,是视频解码的优秀硬件方案。然而在可重构系统上进行高清实时解码还有一定的难度,其中占80%计算量的主要是IDCT(反离散余弦变换)、MC(运动补偿)、Intra-prediction(帧内预测)、deblocking(去块效率滤波)等计算密集型任务。本文基于一款粗粒度可重构处理器,提出了上述计算密集型算法的映射方案,性能优于M.Ganesan与D.Peng在2007、2009年的方案,满足H.264高清实时解码的要求。 展开更多
关键词 H 264 可重构处理器 计算密集型任务 算法映射
在线阅读 下载PDF
流水线配置技术在可重构处理器中的应用 被引量:1
20
作者 于苏东 刘雷波 魏少军 《计算机工程》 CAS CSCD 北大核心 2010年第8期227-229,232,共4页
提出一种应用于可重构处理器中的流水线配置技术,能够有效减低配置时间,提高应用程序的执行速度。可重构处理器包括通用处理器和一个粗颗粒度的可重构阵列。可重构阵列将处理应用中占据大量执行时间的循环,这些循环将被分解为不同的行... 提出一种应用于可重构处理器中的流水线配置技术,能够有效减低配置时间,提高应用程序的执行速度。可重构处理器包括通用处理器和一个粗颗粒度的可重构阵列。可重构阵列将处理应用中占据大量执行时间的循环,这些循环将被分解为不同的行在阵列上以流水线的方式执行。该技术在FPGA验证系统上得到了验证。验证的应用包括H.264基准中的整数离散余弦变换和运动估计。相比传统的可重构处理器PipeRench,MorphoSys以及TI的DSPTMS320DM642有大约3.5倍的性能提升。 展开更多
关键词 可重构处理器 循环映射 流水线配置
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部