中间件 | Redis - [全局 hash & 渐进 rehash]

Redis中的全局哈希表是一种用于存储键值对的数据结构,它在服务器中被广泛用于多种目的,包括数据库的键空间和各种缓存数据。

Redis中的全局哈希表采用了渐进式rehash策略,目的是为了数据的平滑迁移,减少rehash期间对服务器性能的影响。

以下是一个简化的Redis全局哈希表结构和渐进式rehash的伪代码示例:




// 哈希表结构
struct dictht {
    dictEntry **table;
    unsigned long size;
    unsigned long sizemask;
    unsigned long used;
};
 
// 哈希表节点结构
struct dictEntry {
    void *key;
    void *val;
    struct dictEntry *next;
};
 
// Redis字典结构
struct dict {
    dictType *type;
    void *privdata;
    dictht ht[2];
    long rehashidx; /* rehashing not in progress if rehashidx == -1 */
    unsigned long iterators; /* number of iterators currently running */
};
 
// 渐进式rehash的伪代码
void rehash(dict *d, int n) {
    int empty_visits = n * 10; /* Max number of empty buckets to visit. */
    if (d->ht[0].used + d->ht[0].deleted < (unsigned long)ht_table_size(d->ht[0].size) * 5)
        return;
    while(n-- && d->ht[0].used != 0) {
        dictEntry *de, *nextde;
        /* 对第一个哈希表的所有节点进行rehash */
        if (d->ht[0].used == 0) break;
        if (iterations++ > empty_visits && (unsigned long)iterations < d->ht[0].size) {
            /* 如果访问空桶次数过多,且rehashIdx没有到达第一个哈希表的末尾,则退出 */
            break;
        }
        if ((de = d->ht[0].table[index]) == NULL) {
            index++;
            continue;
        }
        while(de) {
            unsigned int h;
            nextde = de->next;
            /* 计算键的新哈希值 */
            h = dictHashKey(d, de->key) & d->ht[1].sizemask;
            de->next = d->ht[1].table[h];
            d->ht[1].table[h] = de;
            d->ht[0].used--;
            d->ht[1].used++;
            de = nextde;
        }
    }
    if (d->ht[0].used == 0) {
        zfree(d->ht[0].table);
        d->ht[0] = d->ht[1];
        _dictReset(&d->ht[1]);
        d->rehashidx = -1;
        if (it == 0) d->iterators = 0;
    } else {
        d->rehashidx = index;
        if (n == -1) d->rehashidx = 0;
    }
}

在这个示例中,我们定义了一个Redis字典和两个哈希表,其中一个用于当前数据存储,另一个用于rehash期间的数据迁移。rehash函数负责执行渐进式rehash,它会逐步将第一个哈希表的节点迁移到第二个哈希表,直至所有节点都迁移完成或达到某些限制条件。这个过程可以分步进行,不需要一次性对所有数据进行重新计算哈希值和重新分配内存,因此对服务器性能的影响较小。

最后修改于:2024年08月08日 09:10

评论已关闭

推荐阅读

DDPG 模型解析,附Pytorch完整代码
2024年11月24日
DQN 模型解析,附Pytorch完整代码
2024年11月24日
AIGC实战——Transformer模型
2024年12月01日
Socket TCP 和 UDP 编程基础(Python)
2024年11月30日
python , tcp , udp
如何使用 ChatGPT 进行学术润色?你需要这些指令
2024年12月01日
AI
最新 Python 调用 OpenAi 详细教程实现问答、图像合成、图像理解、语音合成、语音识别(详细教程)
2024年11月24日
ChatGPT 和 DALL·E 2 配合生成故事绘本
2024年12月01日
omegaconf,一个超强的 Python 库!
2024年11月24日
【视觉AIGC识别】误差特征、人脸伪造检测、其他类型假图检测
2024年12月01日
[超级详细]如何在深度学习训练模型过程中使用 GPU 加速
2024年11月29日
Python 物理引擎pymunk最完整教程
2024年11月27日
MediaPipe 人体姿态与手指关键点检测教程
2024年11月27日
深入了解 Taipy:Python 打造 Web 应用的全面教程
2024年11月26日
基于Transformer的时间序列预测模型
2024年11月25日
Python在金融大数据分析中的AI应用(股价分析、量化交易)实战
2024年11月25日
AIGC Gradio系列学习教程之Components
2024年12月01日
Python3 `asyncio` — 异步 I/O,事件循环和并发工具
2024年11月30日
llama-factory SFT系列教程:大模型在自定义数据集 LoRA 训练与部署
2024年12月01日
Python 多线程和多进程用法
2024年11月24日
Python socket详解,全网最全教程
2024年11月27日