基于编码的分布式存储系统研究
基于编码的分布式存储系统研究(论文12000字)
Research on Distributed Storage System Based on Encoding
摘要
大数据时代,互联网的发展为人们带来了方便的同时,也带来了海量的数据。如何大批量且安全地存储这些数据是人们当前所需要解决的问题,因而分布式存储应运而生。分布式存储采用大量廉价的硬盘构建存储量大,可靠性高,拓展性强的存储系统,为了提升存储数据的安全性和可靠性,通常对数据进行编码,增加冗余来提高数据存储的可靠性。常规的编码方案有副本技术,纠删编码,局部修复编码,再生编码。副本技术和纠删编码是时下流行且方便的编码方案,究其原因是实现的方法较为简易,但是随之而来的存储开销和修复开销太大使得人们不得不寻找更合适的编码方案来降低存储开销和修复开销,再生编码和局部修复编码随之诞生。再生编码作为一种纠删编码结合网络编码理论而诞生的新兴的网络编码技术,在存储开销和修复开销方面的优化使其成为了人们所青睐的编码方案。然而同样的再生编码也有他的缺陷,再生编码计算复杂度较高导致修复效率的降低,以及网络环境的限制,再生码不一定能够在最优参数下对数据进行编码。本文针对当前现状,主要研究内容是:比较当前主流编码方案(副本技术,局部修复编码,纠删编码,再生编码),依据网络环境的不同选取合适的编码方案,这样达到对网络资源利用的最大化。 [资料来源:https://www.doc163.com]
关键词:分布式存储;再生编码;纠删编码;存储开销;修复开销
[资料来源:http://www.doc163.com]
目录
第一章绪论 1
1.1研究目的及意义 1
1.2相关技术研究现状分析 1
1.3主要研究内容及结构安排 2
第二章纠删码的基础理论 4
2.1引言 4
2.2纠删编码的技术原理和分类 4
2.3RS码编码重构原理 4
2.4RS码的生成矩阵 7
2.4.1范德蒙德矩阵 7
2.4.2柯西矩阵 7
2.5性能分析 8
第三章再生码的基础理论 9
3.1引言 9
3.2再生码概述和信息流图 9
3.2.1再生码分类 9
3.2.2信息流图 9
3.2.3最小存储和最小修复带宽折中曲线 11
[资料来源:http://www.doc163.com]
3.3性能分析 13
第四章副本技术和局部修复码 14
4.1引言 14
4.2副本技术 14
4.3局部修复码 15
4.3.1最小距离 15
4.3.2最小距离上界函数 15
4.4性能分析 16
第五章基于Matlab的仿真测试 18
5.1Matlab简介 18
5.2不同参数下的编码比较 18
5.2.1n=14,k=9的编码折中曲线 18
5.2.2n=14,d=9编码折中曲线 19
5.2.3d=9,k=9编码折中曲线 20
5.3总结 21
参考文献 23
致谢 24