Institutional Repository
| 基于极值点分块的重复数据检测算法 | |
| 其他题名 | A Duplicate Data Detection Algorithm based on Extremum Deifned Chunking |
| 谢垂益; 卿斯汉 | |
| 2013 | |
| 发表期刊 | 信息网络安全
![]() |
| ISSN | 1671-1122 |
| 期号 | 8页码:10-12 |
| 摘要 | 重复数据检测技术能够大幅降低数据中心的存储量,节省网络带宽,减少建设和运维成本。为了克服基于内容分块(CDC)方法容易出现超长块的缺点,文章提出了基于极值点分块(EDC)的重复数据检测算法。EDC算法先计算出所有右边界在数据块上下限范围内的滑动窗口中数据的指纹,找出最后一个指纹极值,所对应的滑动窗口结束位置作为数据块的分界点,再计算该数据块的哈希值并判断是否重复块。实验结果表明,EDC算法的重复数据检测率、磁盘利用率分别是CDC算法的1.48倍和1.12倍,改进效果显著。 The duplicate data detection technology can significantly reduce the duplication of data in data centers, save network bandwidth, decrease the cost of construction and maintenance. A duplicate data detection algorithm based on Extremum Defined Chunking(EDC) is proposed to overcome the long segment problem of Content Deifned Chunking(CDC) method. The EDC algorithm ifrst calculates all ifngerprints of the sliding windows that their boundary are within the upper and lower limits of data blocks. The last extremum of all ifngerprints is found out, the corresponding end position of the sliding window become the cut-off point of data block. Then the hash value of the data block is calculated to determine whether it is duplicate block. The experimental results show that ECD algorithm, duplicated data detection rate, disk utilization rate is respectively 1.48 times, 1.12 times of CDC algorithm, the effect is signiifcantly notable. |
| 关键词 | 重复数据检测 基于内容分块 基于极值点分块 指纹 Duplicated Data Detection Content Deifned Chunking Extremum Deifned Chunking Ifngerprint |
| 部门归属 | 韶关学院数学与信息科学学院,广东韶关,512005 中国科学院软件研究所,北京,100190 |
| 语种 | 中文 |
| 内容类型 | 期刊论文 |
| URI标识 | http://ir.iscas.ac.cn/handle/311060/17006 |
| 专题 | 中国科学院软件研究所 |
| 推荐引用方式 GB/T 7714 | 谢垂益,卿斯汉. 基于极值点分块的重复数据检测算法[J]. 信息网络安全,2013(8):10-12. |
| APA | 谢垂益,&卿斯汉.(2013).基于极值点分块的重复数据检测算法.信息网络安全(8),10-12. |
| MLA | 谢垂益,et al."基于极值点分块的重复数据检测算法".信息网络安全 .8(2013):10-12. |
| 条目包含的文件 | 条目无相关文件。 | |||||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [谢垂益]的文章 |
| [卿斯汉]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [谢垂益]的文章 |
| [卿斯汉]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [谢垂益]的文章 |
| [卿斯汉]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论