Redis高性能架构详解(图文全面总结)

Redis高性能架构详解(图文全面总结)

Redis现在是大型架构的必备技能,也是大厂重点考察对象,下面我就全面来详解Redis的高性能架构@mikechen

内存存储

Redis之所以速度快,主要原因是它将数据存储在”内存“中,而不是在磁盘上。

原因很简单,内存的读写带宽远高于磁盘,支持更高的并发读写操作。

为什么磁盘慢这么多呢?原因是自己的设计结构,如下图所示:

Redis高性能架构详解(图文全面总结)

一次数据的读写,主要会涉及到:寻道、以及旋转延迟。

寻道

为了读取、或写入数据,首先,磁头需要移动到正确的轨道上,这就是寻道。

如果每次读取,都需要定位到正确的轨道,这就需要时间,特别是机械硬盘,就非常浪费时间。

所以,磁头移动到目标轨道,这是最慢的一步之一。

旋转延迟

当磁头到达目标轨道后,还需要等待盘片,旋转到正确位置以便访问数据块,这就会涉及到“旋转延迟”。

旋转延迟,通常占据了总I/O时间的一大部分,平均延迟时间约为盘片转一圈时间的一半。

所以,这些步骤,都是非常耗费性能的。

而内存,没有磁盘旋转、和磁头移动的机械延迟,访问时间在纳秒级别,而磁盘访问时间在毫秒级别。

所以,内存的速度会快非常多,这也是性能快的核心原因。

 

数据结构高效

Redis提供了多种高效的数据结构(如:字符串、列表、集合、有序集合、哈希等),如下图所示:

Redis高性能架构详解(图文全面总结)

这些数据结构在内存中进行优化,能够快速进行数据操作。

比如:

LPUSH task_queue "task1"
RPOP task_queue

列表使用 QuickList(双向链表),可以在列表两端快速插入和删除元素。

常数时间复杂度:在列表两端进行的操作时间复杂度为 O(1)。

再比如:

SADD user_tags "tag1"
SISMEMBER user_tags "tag1"

集合基于哈希表实现,能够在常数时间内完成添加和检查操作。

 

IO多路复用技术

Redis 的高性能,有功于其使用的 IO 多路复用技术(IO multiplexing)。

IO 多路复用是一种 IO 模型,它使单个线程可以监视多个文件描述符(如:网络套接字)。

这种机制避免了为每个连接创建一个线程或进程的开销,从而提升了性能。

总之,Redis 在处理网络 IO 时采用异步非阻塞模式,利用了操作系统提供的 IO 多路复用技术(如 epoll),可以同时处理多个客户端连接而不会阻塞整个服务进程。

如下图所示:

Redis高性能架构详解(图文全面总结)

IO 多路复用库,包括 :selectpollepoll(Linux)。

在不同的操作系统上,Redis 会选择最适合的 IO 多路复用库,Linux:主要使用 epoll。

epoll 是 Linux 下的高性能 IO 多路复用机制,利用了红黑树和事件就绪队列,提供了更高效的文件描述符管理和事件通知,适合于需要处理大量并发连接的场景。

 

优化的网络通信协议

Redis 使用自己优化的 RESP(REdis Serialization Protocol),网络通信协议。

该协议简单且高效,能够减少网络通信的开销,提升数据传输效率。

总之,Redis 通过上述多个方面的优化、和设计,使得它成为了一个高性能的分布式缓存,适用于各种需要快速响应、和处理大规模数据的应用场景。

作者简介

陈睿|mikechen,10年+大厂架构经验,BAT资深面试官,就职于阿里巴巴、淘宝、百度等一线互联网大厂。

关注作者「mikechen」公众号,获取更多技术干货!

后台回复架构,即可获取《阿里架构师进阶专题全部合集》,后台回复面试即可获取《史上最全阿里Java面试题总结

评论交流
    暂无讨论,说说你的看法吧