Redis删除策略的三种方法及逐出算法实例分析
一、前言
在文章开始之前,我先问大家一个问题:当我们使用指令:expire key second
给一个key设置过期时间,过期时间一到,这个key对应的过期数据
真的被服务器立即删除了吗?答案是并不会立即删除。知道了这个答案,就来看看Redis中如何处理过期的数据。
二、Redis中的数据特征
Redis是一种内存级数据库,所有数据均存放在内存中,内存中的数据可以通过TTL指令获取其状态,有三种状态:
三、时效性数据储存结构
当我们用指令设置过期数据后,数据对应的地址会放在expires空间中,存储方式是哈希,存储的value是过期时间。
四、数据删除策略
数据删除策略目标:
在内存占用与CPU占用之间寻找一种平衡,顾此失彼都会造成整体redis性能的下降,甚至引发服务器宕机或内存泄露
1、定时删除
创建一个定时器,当key设置有过期时间,且过期时间到达时,由定时器任务立即执行对键的删除操作
优点:节约内存,到时就删除,快速释放掉不必要的内存占用
缺点:CPU压力很大,无论CPU此时负载量多高,均占用CPU,会影响redis服务器响应时间和指令吞吐量
2、惰性删除
数据到达过期时间,不做处理。等下次访问该数据时,会调用
expireIfNeeded()
函数来判断该数据是否过期: 如果未过期,返回数据,发现已过期,删除,返回不存在优点:节约CPU性能,发现必须删除的时候才删除
缺点:内存压力很大,出现长期占用内存的数据
3、定期删除
流程分析:
Redis服务器启动初始化时,读取配置server.hz的值,默认为10
然后每秒钟执行10次
serverCron()
方法,该方法用来检测服务器serverCron()
方法又会调用databasesCron()
方法,该方法是用来遍历数据库的,redis默认有16个数据库,从第一个数据库开始databasesCron()
方法又会调用activeExpireCycle()
方法,该方法会对每一个expires[*]
逐一进行检测,每次执行250ms/server.hz;对某个expires[*]
检测时,随机挑选W个key检测如果检测到key超时,则删除key;如果一轮中删除的key的数量>W25%,循环该过程;如果一轮中删除的key的数量≤W25%,检查下一个
expires[*]
,0-15循环。其中W取值=ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP属性值如果activeExpireCycle()执行时间到期,下次从current_db继续向下执行
参数current_db用于记录activeExpireCycle() 进入哪个expires[*] 执行
总结:
周期性轮询redis库中的时效性数据,采用随机抽取的策略,利用过期数据占比的方式控制删除频度内存压力不是很大,长期占用内存的冷数据会被持续清理
五、删除策略对比
六、逐出算法
1、概念引入
当新数据进入redis时,如果内存不足怎么办?Redis使用内存存储数据,在执行每一个命令前,会调用freeMemoryIfNeeded()
检测内存是否充足。如果内存不满足新加入数据的最低存储要求,redis要临时删除一些数据为当前指令清理存储空间。清理数据的策略称为逐出算法。
注意:逐出数据的过程不是100%能够清理出足够的可使用的内存空间,如果不成功则反复执行。当对所有数据尝试完毕后,如果不能达到内存清理的要求,将出现错误信息。
2、八种配置
检测易失数据(可能会过期的数据集server.db[i].expires
)
检测全库数据(所有数据集server.db[i].dict
)
放弃数据驱逐: