Institutional Repository
| GOTOBLAS一般矩阵乘法高效实现机制的研究 | |
| 其他题名 | research on high performance implementation mechanism of gotoblas general matrix-matrix multiplication |
| 蒋孟奇; 张云泉; 宋刚; 李玉成 | |
| 2008 | |
| 发表期刊 | 计算机工程
![]() |
| ISSN | 1000-3428 |
| 卷号 | 34期号:7页码:84 |
| 摘要 | 对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析.结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度.对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库.证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性. |
| 收录类别 | wanfang,cscd,cnki |
| 关键词 | Gotoblas库 一般矩阵乘法 存储层次 分块算法 计算模型 Gotoblas General Matrix-matrix Multiplication Hierarchical Memory Blocking Algorithm Computational Models |
| 部门归属 | 并行计算实验室 |
| 语种 | 中文 |
| 内容类型 | 期刊论文 |
| URI标识 | http://ir.iscas.ac.cn/handle/311060/4298 |
| 专题 | 并行软件与计算科学实验室 |
| 推荐引用方式 GB/T 7714 | 蒋孟奇,张云泉,宋刚,等. GOTOBLAS一般矩阵乘法高效实现机制的研究[J]. 计算机工程,2008,34(7):84. |
| APA | 蒋孟奇,张云泉,宋刚,&李玉成.(2008).GOTOBLAS一般矩阵乘法高效实现机制的研究.计算机工程,34(7),84. |
| MLA | 蒋孟奇,et al."GOTOBLAS一般矩阵乘法高效实现机制的研究".计算机工程 34.7(2008):84. |
| 条目包含的文件 | ||||||
| 文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
| 11.pdf(416KB) | 开放获取 | -- | 请求全文 | |||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [蒋孟奇]的文章 |
| [张云泉]的文章 |
| [宋刚]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [蒋孟奇]的文章 |
| [张云泉]的文章 |
| [宋刚]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [蒋孟奇]的文章 |
| [张云泉]的文章 |
| [宋刚]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论