中国科学院软件研究所机构知识库
Advanced  
ISCAS OpenIR  > 并行计算实验室  > 期刊论文
题名:
SpMV的自动性能优化实现技术及其应用研究
其他题名: automatic performance tuning of sparse matrix-vector multiplication:implementation techniques and its application research
作者: 袁娥 ; 张云泉 ; 刘芳芳 ; 孙相征
关键词: 稀疏矩阵向量乘 ; 启发式算法 ; 自适应性能优化 ; 存储访问模式 ; 寄存器分块
刊名: 计算机研究与发展
发表日期: 2009
卷: 46, 期:7, 页:1117-1126
收录类别: cnki,wanfang,ei
部门归属: 并行计算实验室
摘要: 在科学计算中,稀疏矩阵向量乘(SpMV)是一个十分重要且经常被大量调用的计算内核.由于SpMV一般实现算法的浮点计算和存储访问次数比率非常低,且其存储访问模式极为不规则,其实际运行性能往往很低.通过采用寄存器分块算法和启发式分块大小选择算法,将稀疏矩阵分成小的稠密分块,重用保存在寄存器中向量x元素,可以提高该计算内核的性能.剖析和总结了OSKI软件包所采用的若干关键优化技术,并进行了实际应用性能测试.测试表明,在实际应用这些优化技术的过程中,应用程序对SpMV的调用次数要达到上百次的量级,才能抵消由于应用这些性能优化技术所带来的额外时间开销,取得性能加速效果.在Pentium4和AMD Athlon平台上,测试了10个矩阵,其平均加速比分别达到了1.69和1.48.
内容类型: 期刊论文
URI标识: http://ir.iscas.ac.cn/handle/311060/4286
Appears in Collections:并行计算实验室 _期刊论文

Files in This Item:
File Name/ File Size Content Type Version Access License
5.pdf(664KB)----限制开放-- 联系获取全文

Recommended Citation:
袁娥,张云泉,刘芳芳,等. SpMV的自动性能优化实现技术及其应用研究[J]. 计算机研究与发展,2009-01-01,46(7):1117-1126.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[袁娥]'s Articles
[张云泉]'s Articles
[刘芳芳]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[袁娥]‘s Articles
[张云泉]‘s Articles
[刘芳芳]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2017  中国科学院软件研究所 - Feedback
Powered by CSpace