中国科学院软件研究所机构知识库

Institutional Repository

图片搜索

粘贴图片网址

ISCAS OpenIR > 并行软件与计算科学实验室

	SpMV的自动性能优化实现技术及其应用研究
其他题名	automatic performance tuning of sparse matrix-vector multiplication:implementation techniques and its application research
	袁娥; 张云泉; 刘芳芳; 孙相征
	2009
发表期刊	计算机研究与发展
ISSN	1000-1239
卷号	46 期号:7 页码:1117-1126
摘要	在科学计算中,稀疏矩阵向量乘(SpMV)是一个十分重要且经常被大量调用的计算内核.由于SpMV一般实现算法的浮点计算和存储访问次数比率非常低,且其存储访问模式极为不规则,其实际运行性能往往很低.通过采用寄存器分块算法和启发式分块大小选择算法,将稀疏矩阵分成小的稠密分块,重用保存在寄存器中向量x元素,可以提高该计算内核的性能.剖析和总结了OSKI软件包所采用的若干关键优化技术,并进行了实际应用性能测试.测试表明,在实际应用这些优化技术的过程中,应用程序对SpMV的调用次数要达到上百次的量级,才能抵消由于应用这些性能优化技术所带来的额外时间开销,取得性能加速效果.在Pentium4和AMD Athlon平台上,测试了10个矩阵,其平均加速比分别达到了1.69和1.48.
收录类别	cnki,wanfang,ei
关键词	稀疏矩阵向量乘启发式算法自适应性能优化存储访问模式寄存器分块
部门归属	并行计算实验室
内容类型	期刊论文
URI标识	http://ir.iscas.ac.cn/handle/311060/4286
专题	并行软件与计算科学实验室
推荐引用方式 GB/T 7714	袁娥,张云泉,刘芳芳,等. SpMV的自动性能优化实现技术及其应用研究[J]. 计算机研究与发展,2009,46(7):1117-1126.
APA	袁娥,张云泉,刘芳芳,&孙相征.(2009).SpMV的自动性能优化实现技术及其应用研究.计算机研究与发展,46(7),1117-1126.
MLA	袁娥,et al."SpMV的自动性能优化实现技术及其应用研究".计算机研究与发展 46.7(2009):1117-1126.

条目包含的文件
文件名称/大小	文献类型	版本类型	开放类型	使用许可
5.pdf（664KB）			开放获取	--	请求全文

个性服务

保存到收藏夹

查看访问统计

导出为Endnote文件

谷歌学术

谷歌学术中相似的文章

[袁娥]的文章

[张云泉]的文章

[刘芳芳]的文章

百度学术

百度学术中相似的文章

[袁娥]的文章

[张云泉]的文章

[刘芳芳]的文章

必应学术

必应学术中相似的文章

[袁娥]的文章

[张云泉]的文章

[刘芳芳]的文章

相关权益政策

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。

条目量9806
全文量7506
访问量553633
下载量2