题名 一种RISC型微处理器指令流水线结构
被引量:4
1
作者
齐家月
机构
清华大学微电子学所
出处
《小型微型计算机系统》
CSCD
北大核心
1995年第10期1-5,共5页
基金
国家"八五"重点攻关项目
文摘
求文介绍一种RISC微处理器的指令流水线结构、其工作原理及相关支持技术,包括HELP指令的产生和插入、延迟控制转移以及硬件互锁。
关键词
微处理器
指令流水线
流水线 结构
RISC型
Keywords
Pipeline,Delayed control transfer,Hardwore interlock
分类号
TP362
[自动化与计算机技术—计算机系统结构]
题名 一种采用3级指令流水线的51内核设计
被引量:2
2
作者
黄敏敏
林媛
徐中佑
机构
厦门大学
出处
《现代电子技术》
2005年第20期83-85,共3页
文摘
流水线技术是提高系统带宽的一项强大的实现技术,并且不需要大量附加的硬件设置。在微处理器设计中采用流水线技术是提高微处理器性能的一种很有效的方法。本文主要介绍了自行设计的一种采用3级指令流水线的51内核的设计和实现。内容包括:3级指令流水线的划分以及相应的系统结构框架,51指令集中各种类型指令的执行情况,间接寻址功能的实现方法,流水线数据相关问题的解决方案,最后讨论设计的FPGA实现。
关键词
51内核
指令流水线
数据相关
FPGA
Keywords
51 core
instruction pipeline
data dependence hazard
FPGA
分类号
TP332
[自动化与计算机技术—计算机系统结构]
题名 指令流水线阻塞问题分析
被引量:1
3
作者
柴晓东
机构
黄河科技学院国际学院
出处
《濮阳职业技术学院学报》
2014年第5期143-144,共2页
文摘
计算机处理器采用指令流水线,可大大提高指令的吞吐量。指令流水线中的阻塞,能够使指令流水线发生断流,导致指令流水线性能的降低。结构阻塞、数据阻塞、控制阻塞是指令流水线中具有代表性的三种阻塞。通过对结构阻塞、数据阻塞、控制阻塞产生原因的分析,提出避免三种指令流水线阻塞的方法,保证指令流水线不断流,使处理器的性能达到最优。
关键词
指令流水线
结构阻塞
数据阻塞
控制阻塞
分类号
TP332.2
[自动化与计算机技术—计算机系统结构]
题名 TMS320C55x的指令流水线及其效率的提高
4
作者
梁俊
王玲
机构
东南大学
出处
《单片机与嵌入式系统应用》
2003年第5期11-13,共3页
文摘
TMS320C55x是德州仪器公司推出的新一代低功耗高性能定点数字信号处理器,其指令流水线具有自动保护机制。本文介绍TMS320C55x DSP的指令流水线及其自动保护机制,并探讨指令流水线方式下提高其执行效率的一些问题。
关键词
微处理器
TMS320C55X
指令流水线
数字信号处理器
周期效率
德州仪器公司
分类号
TP332
[自动化与计算机技术—计算机系统结构]
TN911.72
[电子电信—通信与信息系统]
题名 龙芯1号处理器结构设计
被引量:53
5
作者
胡伟武
唐志敏
机构
中国科学院计算技术研究所
出处
《计算机学报》
EI
CSCD
北大核心
2003年第4期385-396,共12页
基金
国家“八六三”高技术研究发展计划软硬件主题重点项目“高性能通用CPU设计”(2001AA111100)
中国科学院知识创新工程方向性项目(KGCX2-109)资助.
文摘
首先介绍了龙芯处理器的研制背景及其技术路线 .分析了龙芯处理器坚持高性能定位、稳扎稳打的设计策略以及兼容主流处理器的原因 ,并指出在目前达到与国外相同主频的客观条件不具备的情况下 ,应走通过优化处理器结构来提高性能的道路 ,并以处理器结构技术的突破为根本 .然后介绍了龙芯 1号处理器的体系结构设计 ,包括基于操作队列复用的动态流水线设计、在乱序执行的情况下实现精确例外处理、取指与转移控制结构、存储管理以及针对缓冲区溢出攻击的系统安全设计等等 .测试表明龙芯 1号处理器的指令流水线效率高 ,其安全设计能有效防范使用缓冲区溢出技术进行的网络攻击 .但龙芯 1号处理器的Cache过小 。
关键词
龙芯1号处理器
结构设计
指令流水线
性能分析
计算机
微处理器
Keywords
Cache memory
Computer architecture
Performance
Pipeline processing systems
Security of data
分类号
TP332
[自动化与计算机技术—计算机系统结构]
题名 LSSIMD阵列微处理器的控制逻辑设计
被引量:11
6
作者
李莉
沈绪榜
机构
西安微电子技术研究所
出处
《计算机学报》
EI
CSCD
北大核心
2000年第5期557-560,共4页
文摘
首先介绍了 L S SIMD阵列微处理器的三种并行性 :数据并行、流水线并行和指令的并行执行 .针对这三种并行性 ,阐述了控制逻辑的设计 .
关键词
SIMD阵列
微处理器
控制逻辑
指令流水线
设计
Keywords
SIMD array microprocessor, control logic, instruction pipelining, three types of instruction operate in parallel
分类号
TP332.02
[自动化与计算机技术—计算机系统结构]
题名 提前分支预测结构及算法研究
被引量:2
7
作者
靳文兵
石峰
左琦
张杨
机构
北京理工大学计算机学院
北方自动控制技术研究所
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第10期2228-2238,共11页
基金
国家自然科学基金项目(60973010)
文摘
在理论上,越来越复杂的分支预测算法和更大的存储结构会使分支预测精度不断提高,但当前复杂算法和庞大数据结构所引发的分支预测时延已无法满足流水线单周期运行要求.针对分支预测精度和时延的矛盾,设计提出提前分支预测结构(ahead branch prediction architecture,ABPA).ABPA为流水线前端取指部件提供简单的分支预测表,以实现快速分支预测;复杂的预测算法和较大的存储结构均被移至流水线后端实现,从而保证了分支预测精度.对于一直难以准确预测的多目标间接分支指令,设计提出基于分支历史和目标路径的间接分支预测算法(indirect branch prediction algorithm based on branch history and target path,BHTP algorithm).提前分支预测算法采用改进的高精度分支预测算法和BHTP算法的混合.嵌入提前分支预测算法的分支预测引擎实现流水线后端的分支推测和目标预测,以及流水线前端的分支预测表更新.实验结果表明:采用ABPA结构和BHTP算法的分支预测系统平均精度达到94.27%.设计不仅实现了快速、高精度分支预测,更为分支预测的深入研究提供了条件.
关键词
分支预测
分支推测
分支目标缓存
间接分支指令
指令流水线
Keywords
branch prediction
branch speculation
branch target buffer
indirect branch
instructionpipeline
分类号
TP302
[自动化与计算机技术—计算机系统结构]
题名 基于GPU的并行计算性能分析模型
被引量:3
8
作者
王卓薇
程良伦
赵武清
机构
广东工业大学计算机学院
出处
《计算机科学》
CSCD
北大核心
2014年第1期31-38,共8页
基金
广州市科技项目(2012Y2-0031)
博士后基金(2013M531825)
国家自然科学基金(U1201251)资助
文摘
针对GPU并行计算领域缺少精确的性能分析模型和有针对性的性能优化方法,提出一种基于GPU的并行计算性能定量分析模型,其通过对指令流水线、共享存储器访存、全局存储器访存的性能建模,来定量分析并行程序,帮助程序员找到程序运行瓶颈,进行有效的性能优化。实验部分通过3个具有代表性的实际应用(稠密矩阵乘法、三对角线性方程组求解、稀疏矩阵矢量乘法)的性能分析证明了该模型的实用性,并有效地实现了算法的优化。
关键词
GPU
性能定量分析模型
指令流水线
共享存储器访存
全局存储器访存
Keywords
GPU, Quantitative performance model, Instruction pipeline, Shared memory access time, Global memory ac- cess time
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 GPU矩阵乘法的性能定量分析模型
被引量:1
9
作者
尹孟嘉
许先斌
熊曾刚
张涛
机构
武汉大学计算机学院
湖北工程学院计算机与信息科学学院
出处
《计算机科学》
CSCD
北大核心
2015年第12期13-17,22,共6页
基金
国家自然科学基金(61370092)
湖北省自然科学基金(2013CFC005)
湖北省中青年创新团队(T201410)资助
文摘
性能评价和优化是设计高效率并行程序必不可少的重要工作,存储系统的性能高低直接影响到处理器的整体性能。利用GPGPU-Sim对GPU的存储层次结构进行了模拟,找出了SM数量与存储控制器数量之间最佳配置关系。矩阵乘法是科学计算领域中的基本组成部分,是一种具有计算和访存密集特点的典型应用,其性能是GPU高性能计算的一个重要指标。性能模型作为并行系统性能评价的新的技术解决方案,具有许多其它性能评价方法无法比拟的优势。建立了一个性能模型,模型通过对指令流水线、共享存储器访存、全局存储器访存进行定量分析,找到了程序运行瓶颈,提高了执行速度。实验证明,该模型具有实用性,并有效地实现了矩阵乘法的优化。
关键词
GPU
GPGPU-Sim
矩阵乘法
性能定量分析模型
指令流水线
共享存储器访存
全局存储器访存
Keywords
GPU, GPGPU-Sim, Matrix multiplication, Quantitative performance analysis model, Instruction pipeline,Shared memory access, Global memory access
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
题名 基于ARM的除法运算优化策略
被引量:3
10
作者
叶凯
杨文淑
包启亮
机构
中国科学院研究生院
中国科学院光电技术研究所
出处
《单片机与嵌入式系统应用》
2006年第3期78-80,共3页
文摘
与传统的4/8位单片机相比,ARM的性能和处理能力是遥遥领先的。但与之相应,ARM的系统设计复杂度和难度,较之传统的设计方法也大大提升了,同时也大大拓展了针对ARM芯片特性进行优化的空间,例如针对指令流水线的优化、针对寄存器分配进行的优化等。
关键词
ARM芯片
优化策略
除法运算
8位单片机
指令流水线
寄存器分配
处理能力
系统设计
设计方法
复杂度
分类号
TP368.12
[自动化与计算机技术—计算机系统结构]
题名 基于可重构计算技术的ASIP设计与实现
被引量:1
11
作者
宋奂寰
王树宗
邵利兵
机构
海军工程大学兵器工程系
出处
《舰船科学技术》
北大核心
2012年第5期78-82,共5页
基金
国防973项目资助(613660202)
中国博士后科学基金资助项目(200902668)
文摘
为了加速计算密集或数据密集类算法,设计了Kahn线程定义的虚拟指令,以及嵌入式粗粒度可重构阵列流水线处理器的体系结构。通过指令流水线设计,实现虚拟指令的并行执行,将指令级并行扩展为线程级并行。系统运行时,采用订阅/发布机制作为可重构阵列的通信机制,利用可重构系统可重复配置的特点,提高了系统的计算效率。通过仿真实验验证了基于可重构计算技术的流水线处理器结构的有效性。
关键词
可重构计算
粗粒度可重构阵列
循环指令流水线
订阅/发布机制
Keywords
reconfigurable computing
ASIP
cycle pipline
subscribe/published mechanism
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
题名 基于GPU计算的虚拟现实仿真系统设计模型
被引量:2
12
作者
顾钦
机构
天津大学计算机系IBM中心
出处
《微处理机》
2005年第2期41-43,49,共4页
基金
天津市自然基金项目 (项目编号 :0 3 3 80 0 5 1 1 )
文摘
现代GPU的诞生为实时的高质量图形生成提供了条件。借助GPU强大的几何运算能力,虚拟现实系统的性能将得到巨大的提升。本文提出了一套基于GPU计算的虚拟现实仿真设计模型,它可以充分发挥现代GPU强大的几何运算能力,将CPU从繁重的运算中解放出来,大大提高虚拟现实系统仿真计算的效率。
关键词
GPU
虚拟现实
固定指令流水线
可编程流水线
Keywords
GPU
Virtual Reality
Fixed Function Pipeline
Programmable Pipeline
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
题名 MSP430与液晶显示器的串行接口方案
被引量:2
13
作者
宋奇兵
李毅
机构
西安电子科技大学
洛阳光电技术发展中心
出处
《单片机与嵌入式系统应用》
2004年第2期46-48,52,共4页
文摘
针对利用微控制器(MCU)控制液晶显示驱动器(LCD)的应用开发实例,提出一种采用串行方式来设计微控制器和液晶显示驱动器之间接口的方案。该方案是在现有点阵式液晶显示屏上附加一个MCU,通过程序设计利用MCU的I/O端口去模拟I2C串行总线,从而实现利用MCU去控制LCD的目的;同时介绍一种在图符液晶显示系统中显示动态曲线的技术和实现方法。
关键词
MSP430
液晶显示器
串行接口
微控制器
指令流水线
分类号
TN873.93
[电子电信—信息与通信工程]
TP334.7
[自动化与计算机技术—计算机系统结构]
题名 一种高速8位单片机的电路实现
14
作者
胡泽军
张生才
李树荣
李育刚
庞科
机构
天津大学专用集成电路设计中心
出处
《微电子学》
CAS
CSCD
北大核心
2003年第6期534-536,540,共4页
文摘
介绍了一种8位高速单片机的电路实现。该单片机采用哈佛结构、指令流水线、双数据总线、组合逻辑微控制器、进位链结构及机器周期为两倍时钟周期等方法,使设计的单片机在晶振为20MHz的条件下,每秒可执行600万条指令。
关键词
单片机
哈佛结构
指令流水线
双数据总线
组合逻辑微控制器
进位链结构
Keywords
Microcontroller
Harvard stucture
Combination logic microcontroller
Carry chain structure
Dual data bus
分类号
TP368.1
[自动化与计算机技术—计算机系统结构]
题名 CPU仿真器结构分析及其IU模块的设计实现
被引量:1
15
作者
郑仁毅
吴锦林
机构
厦门大学
出处
《福建电脑》
2007年第2期147-148,共2页
文摘
CPU仿真器是进行硬件设计评估,系统软件设计开发和计算机体系结构研究的有力工具。在CPU的研制阶段通常也要同时进行操作系统的开发,为了在新型CPU问世之前运行和调试目标操作系统,就必须开发支持操作系统功能的CPU仿真器。因此,CPU仿真器在嵌入式系统的开发中扮演了重要的角色。本文详细分析了CPU仿真器的结构以及其核心模块IU(Instruction Unit)部分的实现。
关键词
嵌入式系统
CPU仿真器
指令流水线
IU
分类号
TP332
[自动化与计算机技术—计算机系统结构]
题名 面向虚拟教学实验室的虚拟机设计与实现
16
作者
伍建军
黄金明
费娥
颜晶晶
机构
中国地质大学研究生院
华中科技大学计算机学院
浙江台州职业技术学院计算机系
出处
《软件导刊》
2007年第10期123-124,共2页
文摘
在分析虚拟机体系结构与虚拟教学实验室特点的基础上,构建了由CPU、存储系统以及I/O系统3大核心模块组成的面向虚拟教学实验室的虚拟机模型,并对其进行了实现。实验结果表明,该虚拟机能够正常稳定地工作,达到了预期的效果。
关键词
虚拟教学实验室
虚拟机
指令流水线
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
题名 当代计算机体系分析及其发展趋势
被引量:1
17
作者
翁爱民
机构
广东新粤交通投资有限公司
出处
《时代金融》
2006年第12X期109-110,共2页
关键词
当代计算机
并行计算机
指令 级并行
超标量
存储系统
指令流水线
CISC
虚拟存储技术
超流水线
并行存储器
分类号
TP302
[自动化与计算机技术—计算机系统结构]
题名 高技术研究——“龙芯”通用CPU
18
出处
《中国科学院院刊》
2004年第2期126-126,共1页
关键词
“龙芯”
CPU
芯片
指令流水线
存储管理系统
编译器
分类号
TP332
[自动化与计算机技术—计算机系统结构]
题名 新书推荐计算机组成与系统结构(第3版)
19
出处
《计算机教育》
2022年第7期F0004-F0004,共1页
文摘
内容简介本书主要介绍计算机组成与系统结构涉及的相关概念、理论和技术,主要内容包括指令集体系结构、数据的表示和存储,以及实现指令集体系结构的计算机各部件的内部工作原理、组成结构及其相互连接。本书共分9章:第1章对计算机系统及其性能评价进行概述性介绍;第2—3章主要介绍数据的机器级表示和运算,以及运算部件的结构与设计;第4—6章介绍指令系统、各种CPU设计技术及指令流水线;第7章主要介绍包含主存、外存、cache和虚拟存储器在内的存储器层次结构;第8章介绍总线互连及输入输出系统;第9章介绍并行处理计算系统的基本硬件结构和并行程序设计编程模型。
关键词
指令 集体系结构
并行程序设计
输入输出系统
虚拟存储器
指令流水线
计算机系统
并行处理
运算部件
分类号
TP3-5
[自动化与计算机技术—计算机科学与技术]
题名 用于微处理器开发的绝佳编译器
20
作者
Daniel Owens
机构
ARM公司
出处
《今日电子》
2015年第5期34-36,共3页
文摘
优秀的编译工具链可以简化嵌入式软件开发并缩短设计时间如果缺乏适当的开发工具,当前针对嵌入式微处理器的软件开发则是一项非常艰巨的任务,而编译工具是开发工具中一个至关重要的组成部分。由于缺乏现成的软件基础架构,例如能够提取硬件细节的强大操作系统,针对微处理器的嵌入式软件开发是特别具有挑战性的。为实现上述目标而进行的软件开发通常"贴近设备"进行,也就是说。
关键词
嵌入式软件开发
编译工具
设计时间
代码生成器
工具链
协处理器
指令 调度
改善软件
指令流水线
函
分类号
TP332
[自动化与计算机技术—计算机系统结构]