ISCAS OpenIR  > 并行软件与计算科学实验室 
CPU-GPU并行矩阵乘法的实现与性能分析
Alternative Titleimplementation and performance analysis of cpu-gpu parallel matrix multiplication
程豪; 张云泉; 张先轶; 李玉成
2010
Source计算机工程
ISSN1000-3428
Volume36Issue:13Pages:24-26,29
English Abstract实现ATI平台上的CPU-GPU混合并行DGEMM,采用在GPU和CPU上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在AMD Phenom II X4 940和ATI FireStream 9270平台上,混合DGEMM性能相对于单独使用GPU平均提升了16%。通过实验验证了混合DGEMM性能、加速比、任务分配比例的估算方法,并探讨了影响混合DGEMM性能的各种因素。
Keyword混合并行 Gpu技术 Dgemm程序 加速比hybrid Parallelization Gpu Dgemm Speedup Ratio
Department中国科学院软件研究所并行计算实验室;中国科学院研究生院;
SubjectComputer Science
Language中文
Content Type期刊论文
URIhttp://ir.iscas.ac.cn/handle/311060/9688
Collection并行软件与计算科学实验室 
Recommended Citation
GB/T 7714
程豪,张云泉,张先轶,等. CPU-GPU并行矩阵乘法的实现与性能分析[J]. 计算机工程,2010,36(13):24-26,29.
APA 程豪,张云泉,张先轶,&李玉成.(2010).CPU-GPU并行矩阵乘法的实现与性能分析.计算机工程,36(13),24-26,29.
MLA 程豪,et al."CPU-GPU并行矩阵乘法的实现与性能分析".计算机工程 36.13(2010):24-26,29.
Files in This Item:
File Name/Size DocType Version Access License
CPU-GPU并行矩阵乘法的实现与性能分(340KB) 开放获取--Application Full Text
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[程豪]'s Articles
[张云泉]'s Articles
[张先轶]'s Articles
Baidu academic
Similar articles in Baidu academic
[程豪]'s Articles
[张云泉]'s Articles
[张先轶]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[程豪]'s Articles
[张云泉]'s Articles
[张先轶]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.