布隆过滤器是一种数据结构,用于检查元素是否可能或者肯定不存在于集合中。布隆过滤器可以有效地解决缓存穿透问题,它可以在数据库之前就判断一个请求的数据一定不存在,从而避免查询数据库,减少数据库压力。
解决方案:
- 使用布隆过滤器:在缓存之前加一层布隆过滤器,当请求过来时,先通过布隆过滤器判断数据是否存在。如果数据不存在,布隆过滤器可以准确地告诉我们数据一定不存在于数据库中,这样就可以直接返回,不用查询数据库,减少数据库压力。
代码示例:
from redis import Redis
from bloom_filter import BloomFilter
# 假设已经有了布隆过滤器的实例
bf = BloomFilter(size=1000000, hash_count=8)
def get_data(data_id):
# 先判断数据是否可能存在
if data_id not in bf:
return None
# 如果可能存在,再从Redis缓存中查询
data = redis_conn.get(data_id)
if data is None:
# 缓存未命中,可能数据不存在,更新布隆过滤器
bf.add(data_id)
return data
- 缓存空对象:当数据库查询结果为空时,也将空对象缓存到Redis中,并设置一个较短的过期时间。这样,在接下来的一段时间内,相同的查询请求就可以直接从缓存中返回,而不会打到数据库。
代码示例:
def get_data(data_id):
data = redis_conn.get(data_id)
if data is None:
# 缓存未命中,查询数据库
data = db_conn.get(data_id)
if data is None:
# 数据库查询结果为空,缓存一个空对象
redis_conn.setex(data_id, 300, 'null')
else:
# 数据库查询结果非空,缓存结果
redis_conn.setex(data_id, 3600, data)
return data
- 使用锁或者队列:当并发请求非常高,且大部分请求都打到数据库时,可以使用分布式锁或者队列来控制数据库的访问。
代码示例:
from redis import Redis
from threading import Lock
lock = Lock()
def get_data(data_id):
data = redis_conn.get(data_id)
if data is None:
with lock:
data = redis_conn.get(data_id)
if data is None:
# 查询数据库
data = db_conn.get(data_id)
if data is not None:
# 缓存结果
redis_conn.setex(data_id, 3600, data)
else:
# 数据库查询结果为空,缓存一个空对象
redis_conn.setex(data_id, 300, 'null')
return data
缓存击穿、雪崩的解决方案:
- 热点数据永不过期:对于经常被访问的数据,可以设置一个很长的过期时间,避免缓存失效造成的击穿问题。
- 随机过期时间:设置缓存时,不要所有的缓存item都设置相