ISCAS OpenIR  > 并行软件与计算科学实验室 
GOTOBLAS一般矩阵乘法高效实现机制的研究
Alternative Titleresearch on high performance implementation mechanism of gotoblas general matrix-matrix multiplication
蒋孟奇; 张云泉; 宋刚; 李玉成
2008
Source计算机工程
ISSN1000-3428
Volume34Issue:7Pages:84
English Abstract对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析.结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度.对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库.证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性.
Indexed Typewanfang,cscd,cnki
KeywordGotoblas库 一般矩阵乘法 存储层次 分块算法 计算模型 Gotoblas General Matrix-matrix Multiplication Hierarchical Memory Blocking Algorithm Computational Models
Department并行计算实验室
Language中文
Content Type期刊论文
URIhttp://ir.iscas.ac.cn/handle/311060/4298
Collection并行软件与计算科学实验室 
Recommended Citation
GB/T 7714
蒋孟奇,张云泉,宋刚,等. GOTOBLAS一般矩阵乘法高效实现机制的研究[J]. 计算机工程,2008,34(7):84.
APA 蒋孟奇,张云泉,宋刚,&李玉成.(2008).GOTOBLAS一般矩阵乘法高效实现机制的研究.计算机工程,34(7),84.
MLA 蒋孟奇,et al."GOTOBLAS一般矩阵乘法高效实现机制的研究".计算机工程 34.7(2008):84.
Files in This Item:
File Name/Size DocType Version Access License
11.pdf(416KB) 开放获取--Application Full Text
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[蒋孟奇]'s Articles
[张云泉]'s Articles
[宋刚]'s Articles
Baidu academic
Similar articles in Baidu academic
[蒋孟奇]'s Articles
[张云泉]'s Articles
[宋刚]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[蒋孟奇]'s Articles
[张云泉]'s Articles
[宋刚]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.