redis系列笔记之数据结构SDS

发布于 2021年 07月 02日 17:25

redis的功能就不多做介绍了,本系列文章重点是从源码角度揣度其设计思想,另外所有的源码都是基于redis3.0.7版的开源包

今天就说一说其底层用于存储字符串的数据结构SDS,话不多少先把关键源码粘出来

typedef char *sds;

struct sdshdr {
    unsigned int len;
    unsigned int free;
    char buf[];
};

先简单说下各个成员代表的意思,len表示存储的字符串长度,free表示buf中剩余的存储空间,buf用于存储字符串。

看了上面的代码不知道你是否会对typedef char *sds;这句话产生疑惑,为什么不是typedef  struct sdshdr *sds?

再看下两个基本的内联方法:

static inline size_t sdslen(const sds s) {
    struct sdshdr *sh = (void*)(s-(sizeof(struct sdshdr)));
    return sh->len;
}

static inline size_t sdsavail(const sds s) {
    struct sdshdr *sh = (void*)(s-(sizeof(struct sdshdr)));
    return sh->free;
}

内联方法中获取sds存储的字符串长度时为什么 是通过(void*)(s-(sizeof(struct sdshdr)))获取struct sdshdr *对象?

带着这两疑惑看下它的初始化方法:

sds sdsnewlen(const void *init, size_t initlen) {
    struct sdshdr *sh;

    if (init) {
        sh = zmalloc(sizeof(struct sdshdr)+initlen+1); //+1是为了预留一个位置保存''
    } else {
        sh = zcalloc(sizeof(struct sdshdr)+initlen+1);
    }
    if (sh == NULL) return NULL;
    sh->len = initlen;
    sh->free = 0;
    if (initlen && init)
        memcpy(sh->buf, init, initlen);
    sh->buf[initlen] = '';
    return (char*)sh->buf;
}

是不是有点小明白了,其实sds指针并不是指向sdshdr的首地址,而是buf的地址,这也就是为什么要通过(void*)(s-(sizeof(struct sdshdr)))获取struct sdshdr *对象

从初始化方法可以看出,sds其实是对char数组的一种扩展,在数组前添加了两个int空间存储字符串长度和剩余空间,添加这两个属性的好处是:

①降低了获取字符串长度的时间复杂度,变成了O(1)

②通过校验剩余空间大小,可以避免字符串操作中常会发生的数组越界问题