Institutional Repository
| 对角线稀疏矩阵的SpMV自适应性能优化 | |
| 其他题名 | auto-tuning of spmv for diagonal sparse matrices |
| 孙相征; 张云泉; 王婷; 李焱; 袁良 | |
| 2013 | |
| 发表期刊 | 计算机研究与发展
![]() |
| ISSN | 1000-1239 |
| 卷号 | 50期号:3页码:648-656 |
| 摘要 | 稀疏矩阵向量乘(SpMV)是科学计算中常用的内核之一,其运行速率跟非零元分布相关.针对对角线稀疏矩阵,提出了压缩行片段对角(compressed row segment diagonal,CRSD)存储格式.它利用"对角线格式"有效描述矩阵的对角线分布,区别于以往通用的计算方法,CRSD通过对给定应用的对角线稀疏矩阵采样再进行特定的优化.并且在软件安装阶段,通过自适应的方法选取适合具体运行平台的最优SpMV实现.在CPU端进行多线程并行化实现时,自适应调优过程中收集的信息还被用于线程间任务划分,以实现负载平衡.同时完成CRSD存储格式在GPU端的实现,并根据GPU端计算与访存的特点进行优化.实验结果表明:在Intel和AMD的多核平台使用相同线程数的情况下,与DIA相比,使用CRSD的加速比可以达到2.37X(平均1.7X);与CSR相比,可以达到4.6X(平均2.1X). |
| 收录类别 | CNKI ; WANFANG |
| 关键词 | Crsd 自适应性能优化spmv 对角线格式 对角线稀疏矩阵 Gpu 科学应用 |
| 部门归属 | 中国科学院软件所并行软件与计算科学实验室;计算机科学国家重点实验室(中国科学院软件研究所);中国科学院大学; |
| 资助者 | 国家“八六三”高技术研究发展计划基金项目(2009AA01A129,2009AA01A134)|国家“核高基”重大科技专项基金项目(2009ZX01036-001-002)|中国科学院知识创新工程重大项目课题(KGCX1-YW-13)|国家重大科研装备研制项目(ZDYZ2008-2)|国家自然科学基金项目(61100073,61133005,61100066)|中国科学院研究生科技创新与社会实践资助专项 |
| 语种 | 中文 |
| 内容类型 | 期刊论文 |
| URI标识 | http://ir.iscas.ac.cn/handle/311060/15531 |
| 专题 | 中国科学院软件研究所 |
| 推荐引用方式 GB/T 7714 | 孙相征,张云泉,王婷,等. 对角线稀疏矩阵的SpMV自适应性能优化[J]. 计算机研究与发展,2013,50(3):648-656. |
| APA | 孙相征,张云泉,王婷,李焱,&袁良.(2013).对角线稀疏矩阵的SpMV自适应性能优化.计算机研究与发展,50(3),648-656. |
| MLA | 孙相征,et al."对角线稀疏矩阵的SpMV自适应性能优化".计算机研究与发展 50.3(2013):648-656. |
| 条目包含的文件 | 条目无相关文件。 | |||||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [孙相征]的文章 |
| [张云泉]的文章 |
| [王婷]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [孙相征]的文章 |
| [张云泉]的文章 |
| [王婷]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [孙相征]的文章 |
| [张云泉]的文章 |
| [王婷]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论