Institutional Repository
| SpMV的自动性能优化实现技术及其应用研究 | |
| 其他题名 | automatic performance tuning of sparse matrix-vector multiplication:implementation techniques and its application research |
| 袁娥; 张云泉; 刘芳芳; 孙相征 | |
| 2009 | |
| 发表期刊 | 计算机研究与发展
![]() |
| ISSN | 1000-1239 |
| 卷号 | 46期号:7页码:1117-1126 |
| 摘要 | 在科学计算中,稀疏矩阵向量乘(SpMV)是一个十分重要且经常被大量调用的计算内核.由于SpMV一般实现算法的浮点计算和存储访问次数比率非常低,且其存储访问模式极为不规则,其实际运行性能往往很低.通过采用寄存器分块算法和启发式分块大小选择算法,将稀疏矩阵分成小的稠密分块,重用保存在寄存器中向量x元素,可以提高该计算内核的性能.剖析和总结了OSKI软件包所采用的若干关键优化技术,并进行了实际应用性能测试.测试表明,在实际应用这些优化技术的过程中,应用程序对SpMV的调用次数要达到上百次的量级,才能抵消由于应用这些性能优化技术所带来的额外时间开销,取得性能加速效果.在Pentium4和AMD Athlon平台上,测试了10个矩阵,其平均加速比分别达到了1.69和1.48. |
| 收录类别 | cnki,wanfang,ei |
| 关键词 | 稀疏矩阵向量乘 启发式算法 自适应性能优化 存储访问模式 寄存器分块 |
| 部门归属 | 并行计算实验室 |
| 内容类型 | 期刊论文 |
| URI标识 | http://ir.iscas.ac.cn/handle/311060/4286 |
| 专题 | 并行软件与计算科学实验室 |
| 推荐引用方式 GB/T 7714 | 袁娥,张云泉,刘芳芳,等. SpMV的自动性能优化实现技术及其应用研究[J]. 计算机研究与发展,2009,46(7):1117-1126. |
| APA | 袁娥,张云泉,刘芳芳,&孙相征.(2009).SpMV的自动性能优化实现技术及其应用研究.计算机研究与发展,46(7),1117-1126. |
| MLA | 袁娥,et al."SpMV的自动性能优化实现技术及其应用研究".计算机研究与发展 46.7(2009):1117-1126. |
| 条目包含的文件 | ||||||
| 文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
| 5.pdf(664KB) | 开放获取 | -- | 请求全文 | |||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [袁娥]的文章 |
| [张云泉]的文章 |
| [刘芳芳]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [袁娥]的文章 |
| [张云泉]的文章 |
| [刘芳芳]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [袁娥]的文章 |
| [张云泉]的文章 |
| [刘芳芳]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论