ISCAS OpenIR  > 并行软件与计算科学实验室 
国产百万亿次机群系统Alltoall性能测试与分析
其他题名performance test and analysis of alltoall collective communication on domestic hundred trillion times cluster system
饶立; 张云泉; 李玉成
2010
发表期刊计算机科学
ISSN1002-137X
卷号37期号:8页码:186-188,207
摘要随着高性能计算机的应用和发展,并行应用程序所使用的处理器数越来越多,进程间的通信量也不断增多,这对应用程序的性能有很大影响。在采用一种快速傅里叶变换HFFT对曙光5000A进行性能测试时发现,MPI集合通信函数MPI Alltoall的巨大通信开销是并行程序设计的瓶颈。为此,对现有主流Alltoall算法在曙光5000A和深腾7000上进行性能测试与分析,以期对未来的Alltoall算法的优化工作做出贡献。利用不同消息长度和不同进程数测试了Alltoall函数多种算法的性能,这些算法包括二维网格算法、三维网格算法、Bruck算法、原始算法、成对交换算法、递归倍增算法、环算法以及LAM/MPI中的简单算法等。实验结果表明:消息长度较小时,在曙光5000A上采用原始算法和Bruck算法的性能较好,而在深腾7000上用时较少的算法是简单算法和Bruck算法;对于长消息,曙光5000A上最优的算法是环算法,深腾7000上成对交换性能最优。
关键词集合通信 Alltoall 曙光5000a 性能测试与分析alltoall Collective Communication Dawning 5000a Performance Test And Analysis
部门归属中国科学院软件研究所并行计算实验室;中国科学院软件研究所计算机科学国家重点实验室;
学科领域Automation & Control Systems
语种中文
内容类型期刊论文
URI标识http://ir.iscas.ac.cn/handle/311060/9852
专题并行软件与计算科学实验室 
推荐引用方式
GB/T 7714
饶立,张云泉,李玉成. 国产百万亿次机群系统Alltoall性能测试与分析[J]. 计算机科学,2010,37(8):186-188,207.
APA 饶立,张云泉,&李玉成.(2010).国产百万亿次机群系统Alltoall性能测试与分析.计算机科学,37(8),186-188,207.
MLA 饶立,et al."国产百万亿次机群系统Alltoall性能测试与分析".计算机科学 37.8(2010):186-188,207.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
国产百万亿次机群系统Alltoall性能(543KB) 开放获取--请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[饶立]的文章
[张云泉]的文章
[李玉成]的文章
百度学术
百度学术中相似的文章
[饶立]的文章
[张云泉]的文章
[李玉成]的文章
必应学术
必应学术中相似的文章
[饶立]的文章
[张云泉]的文章
[李玉成]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。