一、缓存穿透：如何应对恶意不存在的数据查询

1.1 问题本质与典型场景

缓存穿透指查询一个数据库中不存在的数据时，由于缓存层未命中，导致所有请求直接穿透到数据库层。在恶意攻击或业务逻辑缺陷场景下，高频查询不存在的键会导致数据库连接池耗尽，甚至引发服务不可用。例如：用户ID为负数的查询请求、已删除的商品ID查询等。

1.2 解决方案对比

方案一：空值缓存策略

# 伪代码示例：设置空值缓存
def get_user_info(user_id):
    cache_key = f"user:{user_id}"
    cached_data = redis.get(cache_key)
    if cached_data is None:
        db_data = db.query(f"SELECT * FROM users WHERE id={user_id}")
        if db_data is None:
            # 设置空值缓存，过期时间建议5-10分钟
            redis.setex(cache_key, 300, "NULL")
            return None
        else:
            redis.set(cache_key, json.dumps(db_data), ex=3600)
            return db_data
    elif cached_data == "NULL":
        return None
    else:
        return json.loads(cached_data)

适用场景：业务上存在大量合法但无数据的查询场景，如已注销用户查询。

方案二：布隆过滤器优化

布隆过滤器通过哈希函数将键映射到位数组，可高效判断键是否存在。其特性包括：

空间效率高：1.8亿数据仅需134MB内存
误判率可控：典型场景下误判率<0.01%
不支持删除操作（需使用计数布隆过滤器改进）

部署建议：

初始化阶段将所有合法键加载到布隆过滤器
查询前先检查布隆过滤器，若不存在则直接返回
定期同步数据库变更到布隆过滤器（可通过消息队列实现）

二、缓存击穿：热点键的并发保护机制

2.1 问题复现与影响

当热点键缓存过期时，大量并发请求同时触发数据库查询，导致数据库瞬时QPS激增。典型场景包括：

电商秒杀活动的商品库存查询
社交平台的热点话题访问
金融行业的实时行情数据

2.2 三种防护方案

方案一：逻辑过期策略

// Java示例：热点键永不过期+后台刷新
public class HotKeyCache {
    private static final String HOT_KEY = "hot:product:1001";
    private static final long REFRESH_INTERVAL = 5000; // 5秒刷新间隔
    public String getHotData() {
        String cached = redis.get(HOT_KEY);
        if (cached != null) {
            CacheValue value = JSON.parseObject(cached, CacheValue.class);
            if (System.currentTimeMillis() < value.getExpireTime()) {
                return value.getData();
            }
            // 异步刷新缓存
            asyncRefreshCache();
        }
        // 降级处理：返回最近有效数据或默认值
        return getFallbackData();
    }
    private void asyncRefreshCache() {
        // 使用线程池或消息队列实现异步刷新
    }
}

方案二：分布式互斥锁

锁粒度设计：

细粒度锁：按数据ID分片（如lock1001）
粗粒度锁：按业务类型划分（如lockquery）

锁实现方案：

Redis SETNX命令实现
Redisson分布式锁
某开源协调服务实现

方案三：本地缓存兜底

构建多级缓存架构：

客户端请求 → 本地缓存（Guava Cache，TTL=1s） → 分布式缓存（Redis） → 数据库

配置建议：

本地缓存容量控制在1000条以内
设置合理的淘汰策略（LRU/LFU）
监控本地缓存命中率（建议>80%）

三、缓存雪崩：大规模失效的防御体系

3.1 雪崩产生机理

当大量缓存键的过期时间集中在某个时间点时，任何触发缓存失效的操作（如重启、批量更新）都可能导致数据库崩溃。数学模型显示：

10万缓存键同时过期可使数据库QPS激增100倍
恢复时间取决于数据库扩容能力，通常需要30分钟以上

3.2 四种防御策略

策略一：随机过期时间

# Python示例：设置随机过期时间
import random
def set_cache_with_jitter(key, value, base_ttl=3600):
    jitter = random.randint(0, 600)  # 添加0-10分钟随机偏移
    ttl = base_ttl + jitter
    redis.setex(key, ttl, value)

策略二：分层缓存架构

构建三级缓存体系：
| 层级 | 存储介质 | TTL | 容量 | 适用场景 |
|———|————————|———-|————|————————————|
| L1 | 本地内存缓存 | 1-5s | 100MB | 极高频数据 |
| L2 | Redis集群 | 5-30m | 100GB | 热点数据 |
| L3 | 持久化存储 | 永久 | TB级 | 低频访问的冷数据 |

策略三：熔断降级机制

实现步骤：

监控数据库连接池使用率（阈值建议70%）
当触发阈值时，自动启用降级策略：
- 返回缓存空值
- 返回默认值
- 排队等待（需设置超时时间）
通过日志服务记录降级事件

策略四：缓存预热方案

实施流程：

业务低峰期执行预热脚本
按访问频率排序加载TOP N数据
使用并行加载提升效率（建议并发数<10）
监控预热进度与成功率

四、数据一致性：缓存与数据库的同步难题

4.1 一致性模型选择

模型	特点	适用场景
强一致性	缓存与数据库实时同步	金融交易、库存系统
最终一致性	允许短暂不一致，最终达成一致	社交信息、新闻内容
弱一致性	不保证数据一致性	日志收集、监控数据

4.2 典型同步方案

方案一：Cache Aside Pattern

// 更新数据流程
public void updateData(String id, String newData) {
    // 1. 先更新数据库
    db.update(id, newData);
    // 2. 再删除缓存（而非更新）
    redis.del("data:" + id);
}
// 查询数据流程
public String getData(String id) {
    // 1. 先查缓存
    String cached = redis.get("data:" + id);
    if (cached != null) {
        return cached;
    }
    // 2. 缓存未命中时查数据库
    String dbData = db.query(id);
    if (dbData != null) {
        // 3. 写入缓存，设置合理TTL
        redis.setex("data:" + id, 3600, dbData);
    }
    return dbData;
}

方案二：异步消息同步

实现要点：

数据库变更通过消息队列（如Kafka）发布事件
消费者组处理缓存更新逻辑
实现至少一次语义的消息投递
添加幂等处理机制（使用唯一ID去重）

方案三：数据库日志监听

技术实现：

MySQL：解析binlog（推荐使用Canal）
PostgreSQL：监听WAL日志
MongoDB：使用oplog

性能对比：
| 技术方案 | 延迟 | 吞吐量 | 实现复杂度 |
|————————|————|————|——————|
| 消息队列 | 100ms+ | 10万+ | 中 |
| 数据库日志监听 | 10ms+ | 5万+ | 高 |
| 定时全量同步 | 分钟级 | 低 | 低 |

五、最佳实践总结

缓存键设计：采用业务前缀+唯一ID的格式（如order:20230001）
监控体系：建立包含命中率、过期数、淘汰数的监控面板
容量规划：Redis内存使用率建议控制在70%以下
故障演练：定期进行缓存失效模拟测试
版本控制：缓存数据添加版本号，便于问题排查

通过系统性应用上述方案，可有效解决90%以上的缓存相关问题。实际部署时建议结合业务特点进行方案组合，例如电商系统可采用”随机过期+热点保护+熔断降级”的复合策略。对于超大规模系统，建议引入专业的缓存中间件或某托管缓存服务，以降低运维复杂度。

Redis缓存优化实战：从基础到进阶的四大问题解决方案