ISCAS OpenIR  > 并行软件与计算科学实验室 
CPU-GPU并行矩阵乘法的实现与性能分析
其他题名implementation and performance analysis of cpu-gpu parallel matrix multiplication
程豪; 张云泉; 张先轶; 李玉成
2010
发表期刊计算机工程
ISSN1000-3428
卷号36期号:13页码:24-26,29
摘要实现ATI平台上的CPU-GPU混合并行DGEMM,采用在GPU和CPU上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在AMD Phenom II X4 940和ATI FireStream 9270平台上,混合DGEMM性能相对于单独使用GPU平均提升了16%。通过实验验证了混合DGEMM性能、加速比、任务分配比例的估算方法,并探讨了影响混合DGEMM性能的各种因素。
关键词混合并行 Gpu技术 Dgemm程序 加速比hybrid Parallelization Gpu Dgemm Speedup Ratio
部门归属中国科学院软件研究所并行计算实验室;中国科学院研究生院;
学科领域Computer Science
语种中文
内容类型期刊论文
URI标识http://ir.iscas.ac.cn/handle/311060/9688
专题并行软件与计算科学实验室 
推荐引用方式
GB/T 7714
程豪,张云泉,张先轶,等. CPU-GPU并行矩阵乘法的实现与性能分析[J]. 计算机工程,2010,36(13):24-26,29.
APA 程豪,张云泉,张先轶,&李玉成.(2010).CPU-GPU并行矩阵乘法的实现与性能分析.计算机工程,36(13),24-26,29.
MLA 程豪,et al."CPU-GPU并行矩阵乘法的实现与性能分析".计算机工程 36.13(2010):24-26,29.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
CPU-GPU并行矩阵乘法的实现与性能分(340KB) 开放获取--请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[程豪]的文章
[张云泉]的文章
[张先轶]的文章
百度学术
百度学术中相似的文章
[程豪]的文章
[张云泉]的文章
[张先轶]的文章
必应学术
必应学术中相似的文章
[程豪]的文章
[张云泉]的文章
[张先轶]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。