HASH GAME - Online Skill Game GET 300
云存储算法研究-一致性哈希算法分析云存储算法研究:一致性哈希算法解析–节选《揭秘云存储》上一节中讲到Isilon的无中心节点的分布式存储优势,只有真正的消除云数据服务器的瓶颈才能将云存储的优势发挥到极致。而如何能让云存储中每一个数据节点都有管理功能,如何在云架构中建立一个平衡的系统,才是云存储的关键技术,让我们以亚马逊的dynamo为例子说明云存储中比较好的一种云存储的算法一致性哈希算法。consistenthashing算法早在1997年就在论文Consistenthashingandrandomtrees中被提出,目前在分布式存储系统中应用越来越广泛;1基本场景比如你有N个存储服务器(后面简称存储),那么如何将一个对象object映射到N个存储上呢,你很可能会采用类似下面的通用方法计算object的hash值,然后均匀的映射到到N个存储;hash(object)%N一切都运行正常,再考虑如下的两种情况;存储服务器mdown掉了(在实际应用中必须要考虑这种情况),这样所有映射1一个到存储m的对象都会失效,怎么办,需要把存储m从存储中移除,这时候存储是N-1台,映射公式变成了hash(object)%(N-1);2由于访问加重,需要添加存储,这时候存储是N+1台,映射公式变成了hash(object)%(N+1);1和2意味着什么,这意味着突然之间几乎所有的存储分配机制都失效了。对于服务器而言,这是一场灾难,洪水般的访问都会直接冲向后台服务器;再来考虑第三个问题,由于硬件能力越来越强,你可能想让后面添加的节点多做点活,显然上面的hash算法也做不到。有什么方法可以改变这个状况呢,这就是consistenthashing...hash算法和单调性Hash算法的一个衡量指标是单调性(Monotonicity),定义如下:单调性是指如果已经有一些内容通过哈希分派到了相应的缓冲中,又有新的缓冲加入到系统中。哈希的结果应能够保证原有已分配的内容可以被映射到新的缓冲中去,而不会被映射到旧的缓冲集合中的其他缓冲区。容易看到,上面的简单hash算法hash(object)%N难以满足单调性要求。3consistenthashing算法的原理consistenthashing是一种hash算法,简单的说,在移除/添加一个存储时,它能够尽可能小的改变已存在key映射关系,尽可能的满足单调性的要求。下面就来按照5个步骤简单讲讲consistenthashing算法的基本原理。,也即是0~2-1次方的数值空间;我们可以将这个空间想象成一个首(0)尾(2-1)相接的圆环,如下面图1所示的那样。~object4,通过hash函数计算出的hash值key在环上的分布如图2所示。hash(object1)=key1;„„hash(object4)=key4;,并且使用相同的hash算法。假设当前有A,B和C共3台存储,那么其映射结果将如图3所示,他们在hash空间中