Institutional Repository
| 基于OpenCL的归约算法优化研究 | |
| 颜深根; 张云泉; 龙国平 | |
| 2011 | |
| 会议名称 | 2011年全国高性能计算学术年会(HPC china2011) |
| 会议日期 | 2011 |
| 会议地点 | 济南 |
| 收录类别 | WANFANG |
| 摘要 | 归约算法在科学计算和图像等领域有着广泛应用,本文系统研究了在OpenCL 框架下,归约算法在 GPU上的跨平台性能优化.已有研究工作一般只侧重单个硬件架构,本文基于 OpenCL 从向量化、片上存储体冲突、线程组织方式和指令选择优化等多个优化角度系统考察了不同优化方法在GPU 硬件平台的影响.具体以minMax函数为例对每种优化方法进行了详细的性能分析,并给出了提高性能的原因.在AMD GPU和NVIDIA GPU平台分别测试的结果表明优化后的算法在两个平台上都能实现很好的性能加速.在AMD ATI Radeon HD 5850平台上,Int和Float类型数据带宽利用最高达到了实测带宽的89%.在NVIDIA GPU Tesla C2050 平台上,性能也达到了CUDA版本的相应函数性能的1.3~1.9 倍. |
| 关键词 | Gpu 并行归约 Opencl Cuda |
| 主办者 | 中国计算机学会 |
| 语种 | 中文 |
| 内容类型 | 会议论文 |
| URI标识 | http://ir.iscas.ac.cn/handle/311060/16328 |
| 专题 | 中国科学院软件研究所 |
| 推荐引用方式 GB/T 7714 | 颜深根,张云泉,龙国平. 基于OpenCL的归约算法优化研究[C],2011. |
| 条目包含的文件 | 条目无相关文件。 | |||||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [颜深根]的文章 |
| [张云泉]的文章 |
| [龙国平]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [颜深根]的文章 |
| [张云泉]的文章 |
| [龙国平]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [颜深根]的文章 |
| [张云泉]的文章 |
| [龙国平]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论