一、精准查询：避免全字段扫描陷阱

1.1 全字段查询的性能代价

在开发过程中，SELECT *的写法虽便捷却存在多重隐患。以用户表查询为例：

-- 反例：全字段查询
SELECT * FROM users WHERE user_id = 1001;

当表包含50个字段且单行数据量达2KB时，实际仅需3个字段的查询会强制读取100KB数据。这种过度读取导致：

内存压力：MySQL缓冲池（Buffer Pool）需存储更多无效数据
网络开销：1000QPS场景下每日多传输17GB数据
索引失效：无法利用覆盖索引（Covering Index）特性

1.2 覆盖索引优化实践

通过指定精确字段实现覆盖索引：

-- 正例：精准字段查询
SELECT username, email, registration_date 
FROM users 
WHERE user_id = 1001;

优化效果显著：

索引扫描后直接返回数据，无需回表
在百万级数据表中，查询耗时从120ms降至8ms
执行计划显示”Using index”标志

1.3 字段选择原则

业务必需原则：仅查询视图层或业务逻辑需要的字段
类型适配原则：避免SELECT CAST(id AS CHAR)等类型转换操作
关联预判原则：提前分析JOIN操作需要的关联字段

二、集合操作优化：UNION与UNION ALL的抉择

2.1 排重操作的性能损耗

UNION操作包含隐式去重过程：

-- 反例：使用UNION导致性能下降
(SELECT product_id FROM orders WHERE status = 'completed')
UNION
(SELECT product_id FROM returns WHERE return_date > '2023-01-01');

去重过程涉及：

创建临时表存储结果集
对product_id字段排序
遍历比较相邻记录
删除重复记录

在千万级数据量测试中，UNION比UNION ALL多消耗47%的CPU资源。

2.2 高效合并策略

-- 正例：明确使用UNION ALL
(SELECT product_id FROM orders WHERE status = 'completed')
UNION ALL
(SELECT product_id FROM returns WHERE return_date > '2023-01-01');

2.3 替代方案优化

对于复杂集合操作，可考虑：

使用临时表存储中间结果
通过JOIN操作重构查询逻辑
利用窗口函数实现更精细控制

三、表关联策略：小表驱动大表原理

3.1 关联操作性能对比

以订单表(1000万行)与用户表(10万行)关联为例：

IN子查询实现：

-- 潜在性能问题
SELECT * FROM orders 
WHERE user_id IN (SELECT id FROM users WHERE status = 'active');

执行计划显示：

先执行子查询生成临时表
对每行订单执行IN条件判断
索引利用率仅62%

EXISTS优化实现：

-- 推荐实现方式
SELECT o.* FROM orders o
WHERE EXISTS (
    SELECT 1 FROM users u 
    WHERE u.id = o.user_id AND u.status = 'active'
);

优化效果：

索引利用率提升至91%
查询耗时从3.2s降至480ms
减少临时表创建开销

3.2 关联策略选择矩阵

场景特征	推荐方案	优化要点
小表关联大表	IN/EXISTS	确保关联字段有索引
大表关联大表	JOIN	注意驱动表选择
多表关联复杂查询	临时表+索引	分阶段处理降低复杂度
存在NULL值关联	LEFT JOIN	注意NULL值处理逻辑

3.3 驱动表选择原则

数据量原则：优先选择数据量小的表作为驱动表
索引原则：驱动表的关联字段应有索引
过滤原则：先执行过滤条件更严格的表查询

四、综合优化案例解析

4.1 电商订单查询优化

原始查询：

SELECT * FROM orders o
JOIN users u ON o.user_id = u.id
WHERE u.region = 'CN' AND o.status = 'shipped'
ORDER BY o.create_time DESC
LIMIT 100;

优化步骤：

字段精简：仅查询必要字段
索引优化：在(region,status)创建复合索引
关联重写：调整JOIN顺序
分页优化：使用延迟关联技术

优化后实现：

SELECT o.* FROM (
    SELECT id FROM orders 
    WHERE status = 'shipped' 
    ORDER BY create_time DESC 
    LIMIT 100
) AS tmp
JOIN orders o ON tmp.id = o.id
JOIN users u ON o.user_id = u.id
WHERE u.region = 'CN';

性能提升：

查询耗时从2.8s降至120ms
减少98%的无效数据读取
降低75%的内存消耗

4.2 监控数据聚合优化