Institutional Repository
| CPU-GPU并行矩阵乘法的实现与性能分析 | |
| Alternative Title | implementation and performance analysis of cpu-gpu parallel matrix multiplication |
| 程豪; 张云泉; 张先轶; 李玉成 | |
| 2010 | |
| Source | 计算机工程
![]() |
| ISSN | 1000-3428 |
| Volume | 36Issue:13Pages:24-26,29 |
| English Abstract | 实现ATI平台上的CPU-GPU混合并行DGEMM,采用在GPU和CPU上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在AMD Phenom II X4 940和ATI FireStream 9270平台上,混合DGEMM性能相对于单独使用GPU平均提升了16%。通过实验验证了混合DGEMM性能、加速比、任务分配比例的估算方法,并探讨了影响混合DGEMM性能的各种因素。 |
| Keyword | 混合并行 Gpu技术 Dgemm程序 加速比hybrid Parallelization Gpu Dgemm Speedup Ratio |
| Department | 中国科学院软件研究所并行计算实验室;中国科学院研究生院; |
| Subject | Computer Science |
| Language | 中文 |
| Content Type | 期刊论文 |
| URI | http://ir.iscas.ac.cn/handle/311060/9688 |
| Collection | 并行软件与计算科学实验室 |
| Recommended Citation GB/T 7714 | 程豪,张云泉,张先轶,等. CPU-GPU并行矩阵乘法的实现与性能分析[J]. 计算机工程,2010,36(13):24-26,29. |
| APA | 程豪,张云泉,张先轶,&李玉成.(2010).CPU-GPU并行矩阵乘法的实现与性能分析.计算机工程,36(13),24-26,29. |
| MLA | 程豪,et al."CPU-GPU并行矩阵乘法的实现与性能分析".计算机工程 36.13(2010):24-26,29. |
| Files in This Item: | ||||||
| File Name/Size | DocType | Version | Access | License | ||
| CPU-GPU并行矩阵乘法的实现与性能分(340KB) | 开放获取 | -- | Application Full Text | |||
Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.
Edit Comment