ISCAS OpenIR
PLASMA自适应调优与性能优化的设计与实现
吕渐春; 张云泉; 王婷; 肖玄基
2011
会议名称2011年全国高性能计算学术年会(HPC china2011)
页码1-8
会议日期2011
会议地点济南
收录类别WANFANG
部门归属中国科学院软件所并行计算实验室,北京 100190 中国科学院研究生院,北京 100190 中国科学院软件所并行计算实验室,北京 100190
摘要PLASMA是一个高效的线性代数软件包,其数据分布结合分堆、细粒度并行和乱序执行机制大大提高了程序的性能。但PLASMA仍然存在一些问题,比如分块大小对程序性能的影响非常大,以及产生了大量的数据拷贝等。通过对比传统的LAPACK和PLASMA的实现机制,分析了PLASMA中存在的优势和不足,介绍了两种弥补PLASMA自身不足的方法。针对PLASMA的架构,经过大量的测试与分析,提出了边缘矩阵的概念并分析其对性能的影响,据此提出了一种自适应调优的方法。并通过数据拷贝与计算并行的运行方式,进一步提高了PLASMA性能,最后通过大量的测试验证了该优化方法的效果。
关键词Lapack Plasma 自适应调优 优化
主办者中国计算机学会
语种中文
内容类型会议论文
URI标识http://ir.iscas.ac.cn/handle/311060/16324
专题中国科学院软件研究所
推荐引用方式
GB/T 7714
吕渐春,张云泉,王婷,等. PLASMA自适应调优与性能优化的设计与实现[C],2011:1-8.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[吕渐春]的文章
[张云泉]的文章
[王婷]的文章
百度学术
百度学术中相似的文章
[吕渐春]的文章
[张云泉]的文章
[王婷]的文章
必应学术
必应学术中相似的文章
[吕渐春]的文章
[张云泉]的文章
[王婷]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。