Digest of Consistent Hashing

簡介

這是分散式系統中很常用到的技巧，譬如你有個 redis cluster for caching, 就可以用 consistent hashing 來決定資料要放到哪個 redis instance, 優點是當增加或減少 redis node 時，可以最大化的減少資料的搬移

實作細節

會有個 hash function, redis node 的 identifier & data’s key will be applied to that function。想像有個虛擬的環，假設 hash value 的範圍為 0 ~ 999，順時鐘遞增的分佈在環上。redis node 算出來的 hash value will be evenly distributed on the circle. 假設現在有三個 redis nodes A, B, C, hash value 分別為 100, 300, 700, 則 data 的 hash value 順時針走碰到的第一個 node 就是他放的位置。

這樣除了可以確保每份資料都放在同一個 node, 也能確保當新增或減少 redis node 時的資料搬移最少：

假設現在新增了第四個 D node with hash value 500, 則只會影響 hash value 為 301 ~ 500 的資料 (要從 C 搬到 D)

Note: 餘數 (mod) function 不適合作為這邊的 hash function, 譬如上面的例子有三個 nodes, 你用 key % 3 來算 hash value, 當增加一台 node, 幾乎所有資料的 hash value 都會變，就會造成大規模的資料移動

# distributed system, hash table

Digest of Consistent Hashing

簡介

實作細節

評論

分類

標籤雲

最新文章

彙整

標籤

最新文章

彙整

標籤

Your browser is out-of-date!