一、慢查询问题定位与日志配置

1.1 慢查询日志基础配置

慢查询日志是诊断性能问题的核心工具，需重点关注三个系统变量：

-- 查看当前配置状态
SHOW VARIABLES LIKE 'slow_query%';
SHOW VARIABLES LIKE 'long_query_time';
-- 动态启用配置（无需重启）
SET GLOBAL slow_query_log = 'ON';
SET GLOBAL long_query_time = 2;  -- 设置阈值为2秒
SET GLOBAL slow_query_log_file = '/var/log/mysql/mysql-slow.log';

建议生产环境设置1-2秒的阈值，既避免记录过多无意义日志，又能捕捉真实性能问题。日志文件应存储在独立磁盘分区，防止影响数据库服务器I/O性能。

1.2 日志分析工具与方法

推荐使用mysqldumpslow进行日志聚合分析：

# 按执行时间排序（降序）显示前10条慢查询
mysqldumpslow -s t -t 10 /var/log/mysql/mysql-slow.log
# 输出示例解析
Count: 852  Time=3.25s (2769s)  Lock=0.00s (0s)  Rows=50.0 (42600)
SELECT * FROM orders WHERE user_id=123 AND status=1 ORDER BY create_time DESC

关键指标解读：

Count：执行次数
Time：单次平均耗时（括号内为总耗时）
Lock：等待表锁时间
Rows：返回行数（括号内为总行数）

二、SQL执行计划深度解析

2.1 EXPLAIN关键指标解读

通过EXPLAIN获取SQL执行计划：

EXPLAIN SELECT * FROM orders 
WHERE user_id=12345 AND status=1 
ORDER BY create_time DESC 
LIMIT 0,20;

典型问题执行计划特征：
| 指标 | 问题值 | 优化方向 |
|——————-|——————-|———————————-|
| type | ALL | 建立复合索引 |
| key | NULL | 确保索引被使用 |
| rows | 5,000,000 | 减少扫描行数 |
| Extra | Using filesort | 优化排序操作 |

2.2 常见性能杀手识别

全表扫描（type=ALL）：当数据量超过万级时必须警惕
临时表排序（Using temporary）：复杂GROUP BY或ORDER BY易触发
文件排序（Using filesort）：未命中排序字段索引时的典型表现
高过滤率（filtered<10%）：说明WHERE条件选择性差

三、索引优化实战方案

3.1 复合索引设计原则

针对案例中的查询语句，应创建如下复合索引：

ALTER TABLE orders ADD INDEX idx_user_status_time 
(user_id, status, create_time DESC);

索引设计三要素：

选择性优先：将区分度高的字段放在前面（如user_id比status更适合前置）
覆盖索引：包含查询所需所有字段，避免回表
排序优化：将ORDER BY字段纳入索引，消除filesort

3.2 索引使用验证

优化后执行计划应显示：

+----+-------------+--------+-------+-------------------------------+
| id | select_type | table  | type  | key                           |
+----+-------------+--------+-------+-------------------------------+
| 1  | SIMPLE      | orders | ref   | idx_user_status_time          |
+----+-------------+--------+-------+-------------------------------+

关键变化：

type变为ref（索引查找）
key显示使用的索引名
rows显著减少（理想情况下应<1000）
Extra中不再出现Using filesort

四、数据库设计优化建议

4.1 表结构优化方向

垂直拆分：将大表按访问频率拆分为热表和冷表

-- 示例：拆分出高频访问的orders_active表
CREATE TABLE orders_active AS 
SELECT id, user_id, status, amount, create_time 
FROM orders 
WHERE status IN (0,1) AND create_time > DATE_SUB(NOW(), INTERVAL 3 MONTH);

分区表策略：对时间序列数据按范围分区

ALTER TABLE orders PARTITION BY RANGE (YEAR(create_time)) (
  PARTITION p2020 VALUES LESS THAN (2021),
  PARTITION p2021 VALUES LESS THAN (2022),
  PARTITION pmax VALUES LESS THAN MAXVALUE
);

4.2 查询重写技巧

避免SELECT *：明确指定所需字段

-- 优化前
SELECT * FROM orders WHERE user_id=123;
-- 优化后
SELECT id, user_id, amount, create_time 
FROM orders 
WHERE user_id=123;

分页查询优化：使用子查询避免深分页

-- 传统方式（性能差）
SELECT * FROM orders ORDER BY create_time DESC LIMIT 100000, 20;
-- 优化方式（使用索引覆盖）
SELECT * FROM orders 
WHERE id IN (
  SELECT id FROM orders 
  ORDER BY create_time DESC 
  LIMIT 100000, 20
);

五、持续监控与性能基线

5.1 建立性能监控体系

慢查询告警：配置监控系统实时捕获超过阈值的查询
性能趋势分析：使用日志分析工具生成日/周/月报表
基线对比：记录优化前后的关键指标变化

5.2 定期维护任务

-- 每周执行索引维护
ANALYZE TABLE orders;
OPTIMIZE TABLE orders;  -- 适用于MyISAM，InnoDB慎用
-- 每月清理历史数据
DELETE FROM orders WHERE create_time < DATE_SUB(NOW(), INTERVAL 3 YEAR);

六、高级优化技术

6.1 查询缓存策略

对于不常变更的查询，可考虑应用层缓存：

# Python示例：使用Redis缓存查询结果
import redis
import pymysql
r = redis.Redis()
def get_orders(user_id):
    cache_key = f"orders:{user_id}"
    data = r.get(cache_key)
    if data:
        return eval(data)  # 注意：实际生产环境应使用JSON序列化
    conn = pymysql.connect(...)
    cursor = conn.cursor()
    cursor.execute("""
        SELECT id, amount, create_time 
        FROM orders 
        WHERE user_id=%s AND status=1
    """, (user_id,))
    result = cursor.fetchall()
    r.setex(cache_key, 3600, str(result))  # 缓存1小时
    return result

6.2 读写分离架构

通过主从复制实现读写分离：

[客户端] --> [代理层] --> {主库:写操作, 从库:读操作}

典型实现方案：

应用层实现：在代码中区分读写连接
中间件方案：使用ProxySQL等中间件自动路由
云服务方案：采用主流云服务商的数据库代理服务

七、性能优化效果验证

优化后应达到以下指标：

查询响应时间降低80%以上
全表扫描消失
文件排序操作减少90%
系统负载（CPU/IO）明显下降

建议使用性能测试工具进行验证：

# 使用sysbench进行压力测试
sysbench oltp_read_only \
  --db-driver=mysql \
  --mysql-host=127.0.0.1 \
  --mysql-port=3306 \
  --mysql-user=test \
  --mysql-password=test \
  --mysql-db=testdb \
  --tables=10 \
  --table-size=1000000 \
  --threads=50 \
  --time=300 \
  --report-interval=10 \
  run

通过系统化的优化方法，即使是百万级数据表的查询性能也能得到显著提升。实际优化过程中需结合具体业务场景，通过持续监控和迭代优化达到最佳性能状态。

MySQL慢查询优化全攻略：从诊断到性能提升的完整实践