ISCAS OpenIR
SW-VML:基于神威蓝光处理器的向量数学软件包
解庆春; 张云泉; 鲁永泉; 李焱; 杨飞; 王靖
2013
会议名称2013全国高性能计算学术年会
页码1-11
会议日期2013
会议地点桂林
部门归属中国传媒大学高性能计算中心,北京100024;中国科学院软件研究所并行软件与计算科学实验室,北京100190 中国传媒大学高性能计算中心,北京100024;中国科学院计算技术研究所计算机体系结构国家重点实验室,北京100190 中国传媒大学高性能计算中心,北京100024 中国科学院软件研究所并行软件与计算科学实验室,北京100190
摘要  首先,本文介绍了SIMD扩展技术,并分析了使用SIMD扩展的三种万式,认为通过调用特定目标平台优化的第三万库是应用领域软件开发者快速开发高效并行程序的较好的万式:其次,介绍了国产神威处理嚣SW-1600平台,并利用Sl MD扩展和循环展开等技术开发了SW-VML(SW Vector Math Library),开发过程中提出了访存对界、简化向量条件分支的优化万法,解决了非对界访存、向量与标量数组转换影响性能的问题,并根据sw编译嚣对0penMP的支持,开发了多线程0penMp版.最后,在sw_1600平台上采用不同向量规模对SW-VML进行了测试,测试鲒果显示Sl MD向量化相对于串行程序加速比为2.08,4线程相对单线程平均加速比为2,26.SW-VML是国产神威系列处理嚣上开发的常用向量函数软件包,SW-VML可以用作在神威蓝光高性能计算平台开发高性能程序的基础软件工具包.
关键词Simd扩展 神威处理器sw_1600 向量数学库 向量化
语种中文
内容类型会议论文
URI标识http://ir.iscas.ac.cn/handle/311060/16565
专题中国科学院软件研究所
推荐引用方式
GB/T 7714
解庆春,张云泉,鲁永泉,等. SW-VML:基于神威蓝光处理器的向量数学软件包[C],2013:1-11.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[解庆春]的文章
[张云泉]的文章
[鲁永泉]的文章
百度学术
百度学术中相似的文章
[解庆春]的文章
[张云泉]的文章
[鲁永泉]的文章
必应学术
必应学术中相似的文章
[解庆春]的文章
[张云泉]的文章
[鲁永泉]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。