Institutional Repository
| CPU-GPU并行矩阵乘法的实现与性能分析 | |
| 其他题名 | implementation and performance analysis of cpu-gpu parallel matrix multiplication |
| 程豪; 张云泉; 张先轶; 李玉成 | |
| 2010 | |
| 发表期刊 | 计算机工程
![]() |
| ISSN | 1000-3428 |
| 卷号 | 36期号:13页码:24-26,29 |
| 摘要 | 实现ATI平台上的CPU-GPU混合并行DGEMM,采用在GPU和CPU上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在AMD Phenom II X4 940和ATI FireStream 9270平台上,混合DGEMM性能相对于单独使用GPU平均提升了16%。通过实验验证了混合DGEMM性能、加速比、任务分配比例的估算方法,并探讨了影响混合DGEMM性能的各种因素。 |
| 关键词 | 混合并行 Gpu技术 Dgemm程序 加速比hybrid Parallelization Gpu Dgemm Speedup Ratio |
| 部门归属 | 中国科学院软件研究所并行计算实验室;中国科学院研究生院; |
| 学科领域 | Computer Science |
| 语种 | 中文 |
| 内容类型 | 期刊论文 |
| URI标识 | http://ir.iscas.ac.cn/handle/311060/9688 |
| 专题 | 并行软件与计算科学实验室 |
| 推荐引用方式 GB/T 7714 | 程豪,张云泉,张先轶,等. CPU-GPU并行矩阵乘法的实现与性能分析[J]. 计算机工程,2010,36(13):24-26,29. |
| APA | 程豪,张云泉,张先轶,&李玉成.(2010).CPU-GPU并行矩阵乘法的实现与性能分析.计算机工程,36(13),24-26,29. |
| MLA | 程豪,et al."CPU-GPU并行矩阵乘法的实现与性能分析".计算机工程 36.13(2010):24-26,29. |
| 条目包含的文件 | ||||||
| 文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
| CPU-GPU并行矩阵乘法的实现与性能分(340KB) | 开放获取 | -- | 请求全文 | |||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [程豪]的文章 |
| [张云泉]的文章 |
| [张先轶]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [程豪]的文章 |
| [张云泉]的文章 |
| [张先轶]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [程豪]的文章 |
| [张云泉]的文章 |
| [张先轶]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论