-
题名利用循环分割和循环展开避免Cache代价
被引量:2
- 1
-
-
作者
刘利
陈彧
乔林
汤志忠
-
机构
清华大学计算机科学与技术系
-
出处
《软件学报》
EI
CSCD
北大核心
2008年第9期2228-2242,共15页
-
基金
国家自然科学基金~~
-
文摘
存储系统与处理器之间的速度差距逐渐变大,为此,cache使用了分级机制,但这也带来了额外的存储延迟(cache代价).提出一种利用循环分割和循环展开相结合避免cache代价的PCPLPU(prevent cache penalty by loop partition-unrolling)算法.实验结果表明,PCPLPU算法能够有效避免循环代价,提高程序性能.
-
关键词
循环分割
循环展开
cache代价
bank冲突
-
Keywords
loop partition
loop unrolling
cache penalty
bank conflict
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名数据线性划分模式下改进的循环分割算法
- 2
-
-
作者
胡南军
谭文芳
陈道蓄
谢立
-
机构
南京大学计算机科学与技术系计算机软件新技术国家重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2001年第6期37-40,共4页
-
基金
"863"高技术计划的支持(项目号863-306-ZT02-03-01)
-
文摘
1. 概述
与共享存储结构相比,分布式存储结构在性价比和可扩展性上有明显的优势,但它缺乏全局的存储空间,存储器间只能通过消息传统的方式进行通讯,因此等程序员在编写程序时需要考虑如何分布计算和相应的数据,以便尽可能提高分布式程序的并行性同时尽可能减少处理器间的通讯量.这一工作加大了程序员的负担和算法的复杂度.解决这个问题的一个方案就是借助源程序到源程序的并行编译软件的帮助,对串行程序进行并行化分析,自动地对计算和数据进行分布.
-
关键词
循环分割算法
数据线性划分模式
计算机
-
Keywords
Distributed memory ,Linear data distribution, Loop partition, Algorithm
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于SIMD机器的优化数据传输的并行循环分割
被引量:3
- 3
-
-
作者
林进
张兆庆
祝明发
-
机构
中国科学院计算技术研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
1998年第7期577-585,共9页
-
文摘
本文提出一个基于分布式局存的SIMD机器的循环分割理论体系以优化运算中所需要的数据传输.该体系使用矩阵表示迭代空间、数据空间和数组存取式.我们引入数据传输概念,并建立一个简单有效的数据传输模型来评估数据在全局内存和局部内存之间的传输开销.最后,对于给定的循环嵌套,我们给出一个循环分割算法以获得优化循环块,使得循环嵌套中所需要的数据传输开销最小,并且大大减少了数据传输和计算的同步开销.实验结果证明了该算法的有效性.
-
关键词
循环分割
数据传输
SIMD机器
程序设计
-
Keywords
Loop partitioning, footprint, data movement
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名使用代价分析的向量化循环分割技术
- 4
-
-
作者
何越强
-
机构
浙江大学计算机科学与技术学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2011年第6期2020-2023,共4页
-
基金
国家自然科学基金项目(60873045)
国家重大科技专项基金项目(2010ZX01030-001-001)
-
文摘
为了使循环在编译过程中更充分地被向量化,提出了一种基于代价分析的向量化循环分割技术。标记出了迭代依赖间隔中不存在依赖关系的循环片段,在此基础上建立一个简单有效的代价分析模型来评估这些循环片段向量化和未向量化的CPU时钟周期开销,最后从代价分析结果中确定是否需要将其向量化分割,从而把向量化特性应用到细短的循环片段。实验结果表明了该技术的有效性,对迭代依赖距离大的循环片段优化作用更明显。
-
关键词
循环依赖
自动向量化
循环分割
依赖间隔
代价分析
-
Keywords
loop dependence
auto-vectorization
loop partition
dependent interval
cost analysis
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于循环分割自适应机制的WSN信号定位算法研究
- 5
-
-
作者
孙灏
-
机构
安徽广播电视大学滁州分校
-
出处
《大庆师范学院学报》
2018年第6期46-50,共5页
-
文摘
为改善当前WSN信号定位算法存在的时延估计困难且在高混沌信道条件下难以分割噪声频谱与信号频谱的不足,提出了一种基于循环分割自适应机制的WSN信号定位算法,首先采取解析并发的方式将信号进行正交循环切割,实现了在高复杂噪声环境中信号空间与噪声空间相互分离,大大降低了信道噪声对定位信号干扰,有效适应了多径传输过程中难以规避的信道噪声影响;基于角度和时延,构建搜寻聚类矩阵,利用该矩阵具有特征矢量互相分离的特性实现了参数的自适应精度提升,该方式在进一步降低噪声信号影响同时,大大提高了定位过程中精度。仿真实验证明,本算法同超线性频率漂移定位算法、相干度频率映射定位算法、拓扑环一次定位算法相比,定位精度较高且定位错误发生频率下降明显,具有显著实际部署价值。
-
关键词
WSN
信号定位
循环分割
多径传输
-
分类号
TP393.04
[自动化与计算机技术—计算机应用技术]
-
-
题名基于密集循环网络的视网膜图像分割方法
被引量:3
- 6
-
-
作者
杨云
周舒婕
李程辉
张娟娟
-
机构
陕西科技大学人工智能研究所
陕西科技大学电子信息与人工智能学院
-
出处
《液晶与显示》
CAS
CSCD
北大核心
2021年第12期1702-1711,共10页
-
基金
国家自然科学基金(No.61971272)
国家重点研发计划重点专项(No.2019YFC1520204)
+1 种基金
国家自然科学基金青年科学基金(No.61601271)
陕西省教育厅专项科研计划(No.15JK1086)。
-
文摘
针对视网膜血管在分割过程容易出现细节特征信息丢失、血管轮廓模糊等问题,提出一种改进的循环分割对抗网络算法。该算法改进了分割器的网络模型,在U型网络上、下采样过程中添加了密集连接结构,充分保留了图像的特征信息,提升了模型的泛化能力以及鲁棒性,缓解了过度分割现象。为防止网络退化,将损失函数替换为最小二乘函数,提高了图像的分割质量,提升了网络模型训练的稳定性。实验结果表明,本文的网络模型在DRIVE以及CHASE数据集中,两者分割的准确性、敏感性分别达到了96.93%、84.30%以及96.94%、79.92%。该算法具有较好的网络泛化能力以及分割准确率,可以为疾病诊断提供重要的依据。
-
关键词
视网膜血管分割
循环分割对抗网络
U型网络
密集连接结构
损失函数
-
Keywords
retinal blood vessels segmentation
cycle segmentation adversarial networks
U-Net work
densely connected structure
loss function
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名趣谈“循环分割”探究题
- 7
-
-
作者
李其明
杨景菊
-
机构
山东省枣庄十五中
-
出处
《中学生数学(初中版)》
2005年第24期12-,33,共2页
-
文摘
培养动手操作和探究能力是素质教育所 要求的重要内容之一.亲自参与活动进行探 索与发现,以自己的体验获取知识与技能是 数学教学的重要目标.“循环分割”图形的操 作探究题是在操作、观察、猜想、归纳的基础 上探究出这种“循环分割”的规律,使感性认 识升华为理性认识,从而培养数学素养和创 新能力.
-
关键词
直角三角形
探究题
循环分割
-
分类号
G63
[文化科学—教育学]
-
-
题名一种基于分区域优先级的寄存器分配算法
被引量:3
- 8
-
-
作者
岳峰
庞建民
赵荣彩
-
机构
解放军信息工程大学
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2013年第12期3005-3010,共6页
-
基金
国家高技术研究发展计划(2009AA012201)
国家核高基重大专项(2009ZX01036-001-001)
河南省重大科技攻关专项(092101210501)资助课题
-
文摘
编译器速度和生成代码质量是衡量寄存器分配阶段性能的两个关键因素,现代的即时编译器要求在尽可能短的时间内编译出高质量的代码。传统的基于图着色的算法和线性扫描算法均不能很好地满足这个要求,该文提出一种基于矩阵填充的区域优先级寄存器分配算法,不追求理论上完美的寄存器分配,而采用贪婪式的方法,对程序循环区域进行分割,按区域内生命域的长度和溢出权重两种优先级排序方法进行物理寄存器分配,再扩展到整个程序段。算法在保留线性分配时间的同时产生了高质量的代码,应用于编译SSA形式的PTX指令到多核平台的过程中,基于该编译平台的实验证明了该文改进算法的有效性。
-
关键词
编译器
寄存器分配
循环区域分割
贪婪法
生命域长度优先级
溢出权重优先级
-
Keywords
Compiler
Register allocation
Loop region divide
Greedy
Lifetime length priority
Spill weight priority
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名利用多尺度融合的SAR图像变化检测方法
被引量:1
- 9
-
-
作者
全斯农
崔莹
熊博莅
匡纲要
-
机构
国防科学技术大学电子科学与工程学院信息工程系
-
出处
《信号处理》
CSCD
北大核心
2016年第4期430-437,共8页
-
基金
国家自然科学基金(61331338
61401477)
-
文摘
为充分利用图像的细节信息,提高变化检测算法的鲁棒性和稳健性,本文融合了多个尺度间的特征,提出了一种自适应SAR图像变化检测方法。首先采用小波函数对对数比差异图进行多尺度分解,而后采用独立重构的方式,得到不同尺度下的重构图像。接着采用均值循环迭代分割算法,以甄别变化区域与未变化区域。最后将不同尺度下的判别结果,采用马尔科夫随机场融合的方式,来获取最终的变化二值图。通过对不同尺度下的图像进行融合,该方法不仅有效地利用了尺度信息,而且对边缘的检测更加细致。实验结果表明该算法能够有效地提高SAR图像变化检测的精度和鲁棒性。
-
关键词
独立重构
均值循环迭代分割
多尺度融合
变化检测
-
Keywords
independent reconstruction
mean-iterative threshold selection
multi-scale fusion
change detection
-
分类号
TP751
[自动化与计算机技术—检测技术与自动化装置]
-