Redis现在是大型架构的必备技能,也是大厂重点考察对象,下面我就全面来详解Redis的高性能架构@mikechen
内存存储
Redis之所以速度快,主要原因是它将数据存储在”内存“中,而不是在磁盘上。
原因很简单,内存的读写带宽远高于磁盘,支持更高的并发读写操作。
为什么磁盘慢这么多呢?原因是自己的设计结构,如下图所示:
一次数据的读写,主要会涉及到:寻道、以及旋转延迟。
寻道
为了读取、或写入数据,首先,磁头需要移动到正确的轨道上,这就是寻道。
如果每次读取,都需要定位到正确的轨道,这就需要时间,特别是机械硬盘,就非常浪费时间。
所以,磁头移动到目标轨道,这是最慢的一步之一。
旋转延迟
当磁头到达目标轨道后,还需要等待盘片,旋转到正确位置以便访问数据块,这就会涉及到“旋转延迟”。
旋转延迟,通常占据了总I/O时间的一大部分,平均延迟时间约为盘片转一圈时间的一半。
所以,这些步骤,都是非常耗费性能的。
而内存,没有磁盘旋转、和磁头移动的机械延迟,访问时间在纳秒级别,而磁盘访问时间在毫秒级别。
所以,内存的速度会快非常多,这也是性能快的核心原因。
数据结构高效
Redis提供了多种高效的数据结构(如:字符串、列表、集合、有序集合、哈希等),如下图所示:
这些数据结构在内存中进行优化,能够快速进行数据操作。
比如:
LPUSH task_queue "task1" RPOP task_queue
列表使用 QuickList(双向链表),可以在列表两端快速插入和删除元素。
常数时间复杂度:在列表两端进行的操作时间复杂度为 O(1)。
再比如:
SADD user_tags "tag1" SISMEMBER user_tags "tag1"
集合基于哈希表实现,能够在常数时间内完成添加和检查操作。
IO多路复用技术
Redis 的高性能,有功于其使用的 IO 多路复用技术(IO multiplexing)。
IO 多路复用是一种 IO 模型,它使单个线程可以监视多个文件描述符(如:网络套接字)。
这种机制避免了为每个连接创建一个线程或进程的开销,从而提升了性能。
总之,Redis 在处理网络 IO 时采用异步非阻塞模式,利用了操作系统提供的 IO 多路复用技术(如 epoll),可以同时处理多个客户端连接而不会阻塞整个服务进程。
如下图所示:
IO 多路复用库,包括 :select
、poll
、epoll
(Linux)。
在不同的操作系统上,Redis 会选择最适合的 IO 多路复用库,Linux:主要使用 epoll。
epoll 是 Linux 下的高性能 IO 多路复用机制,利用了红黑树和事件就绪队列,提供了更高效的文件描述符管理和事件通知,适合于需要处理大量并发连接的场景。
优化的网络通信协议
Redis 使用自己优化的 RESP(REdis Serialization Protocol),网络通信协议。
该协议简单且高效,能够减少网络通信的开销,提升数据传输效率。
总之,Redis 通过上述多个方面的优化、和设计,使得它成为了一个高性能的分布式缓存,适用于各种需要快速响应、和处理大规模数据的应用场景。
作者简介
陈睿|mikechen,10年+大厂架构经验,BAT资深面试官,就职于阿里巴巴、淘宝、百度等一线互联网大厂。
关注作者「mikechen」公众号,获取更多技术干货!
后台回复【架构】,即可获取《阿里架构师进阶专题全部合集》,后台回复【面试】即可获取《史上最全阿里Java面试题总结》