ISCAS OpenIR  > 并行软件与计算科学实验室 
GOTOBLAS一般矩阵乘法高效实现机制的研究
其他题名research on high performance implementation mechanism of gotoblas general matrix-matrix multiplication
蒋孟奇; 张云泉; 宋刚; 李玉成
2008
发表期刊计算机工程
ISSN1000-3428
卷号34期号:7页码:84
摘要对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析.结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度.对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库.证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性.
收录类别wanfang,cscd,cnki
关键词Gotoblas库 一般矩阵乘法 存储层次 分块算法 计算模型 Gotoblas General Matrix-matrix Multiplication Hierarchical Memory Blocking Algorithm Computational Models
部门归属并行计算实验室
语种中文
内容类型期刊论文
URI标识http://ir.iscas.ac.cn/handle/311060/4298
专题并行软件与计算科学实验室 
推荐引用方式
GB/T 7714
蒋孟奇,张云泉,宋刚,等. GOTOBLAS一般矩阵乘法高效实现机制的研究[J]. 计算机工程,2008,34(7):84.
APA 蒋孟奇,张云泉,宋刚,&李玉成.(2008).GOTOBLAS一般矩阵乘法高效实现机制的研究.计算机工程,34(7),84.
MLA 蒋孟奇,et al."GOTOBLAS一般矩阵乘法高效实现机制的研究".计算机工程 34.7(2008):84.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
11.pdf(416KB) 开放获取--请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[蒋孟奇]的文章
[张云泉]的文章
[宋刚]的文章
百度学术
百度学术中相似的文章
[蒋孟奇]的文章
[张云泉]的文章
[宋刚]的文章
必应学术
必应学术中相似的文章
[蒋孟奇]的文章
[张云泉]的文章
[宋刚]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。