一、索引基础与数据结构

1. 索引的本质与存储机制

索引是数据库系统为加速数据检索而构建的辅助数据结构，其核心价值在于将随机I/O转化为顺序I/O。现代数据库普遍采用B+树作为默认索引结构，这种多路平衡查找树具有三大优势：

磁盘I/O优化：每个节点对应一个磁盘页（通常16KB），通过减少树高度降低I/O次数
范围查询高效：叶子节点通过双向链表连接，支持高效的范围扫描
排序稳定性：B+树的有序特性天然支持ORDER BY等排序操作

-- 创建普通索引示例
CREATE INDEX idx_user_name ON users(username);

2. 哈希索引的适用场景

虽然B+树是主流选择，但哈希索引在等值查询场景下具有独特优势：

精确匹配：O(1)时间复杂度实现快速定位
内存友好：适合构建在内存表或临时表上
局限性：不支持范围查询和排序操作

-- 内存表哈希索引示例
CREATE TABLE memory_table (
    id INT PRIMARY KEY,
    data VARCHAR(100),
    INDEX USING HASH (id)
) ENGINE=MEMORY;

二、索引类型与创建策略

3. 复合索引的构建原则

复合索引（多列索引）的设计需遵循最左前缀原则，其构建应考虑：

列顺序：将高区分度列放在前面（如用户ID>性别）
查询模式：覆盖80%以上的查询条件组合
索引长度：避免过度冗长的索引字段

-- 合理复合索引示例
-- 假设查询模式多为WHERE status=1 AND create_time>'2023-01-01'
CREATE INDEX idx_status_time ON orders(status, create_time);

4. 覆盖索引的优化艺术

覆盖索引指查询所需字段全部包含在索引中，可避免回表操作：

适用场景：聚合查询、简单条件查询
实现方式：在索引中包含所有SELECT字段
性能提升：减少50%-90%的I/O开销

-- 覆盖索引示例
-- 查询仅需id和username字段
CREATE INDEX idx_covering ON users(id, username);
SELECT id, username FROM users WHERE username LIKE '张%';

三、索引使用与优化技巧

5. 索引失效的常见场景

开发者需警惕以下导致索引失效的操作：

隐式类型转换：WHERE string_column = 123
函数操作：WHERE YEAR(create_time) = 2023
模糊查询前导通配符：WHERE name LIKE '%张'
OR条件混合：非索引列与索引列混合使用

6. 索引选择性计算方法

索引选择性=不重复值数量/总记录数，计算示例：

SELECT COUNT(DISTINCT username)/COUNT(*) AS selectivity 
FROM users;

选择性>0.3：适合建索引
选择性>0.8：高区分度字段
选择性<0.1：谨慎建索引

7. 索引维护成本分析

索引虽提升查询性能，但带来额外维护开销：

写入性能下降：INSERT/UPDATE/DELETE需同步更新索引
存储空间增加：每个索引约占用数据表10%-30%空间
优化器决策成本：复杂查询可能因索引过多导致选择困难

四、高级索引技术

8. 索引下推优化（ICP）

MySQL 5.6引入的索引下推技术，将WHERE条件过滤下推到存储引擎层：

-- 传统执行流程：先回表再过滤
-- ICP优化后：在索引遍历时即过滤
SELECT * FROM users 
WHERE name LIKE '张%' AND age > 20;

9. 自适应哈希索引（AHI）

InnoDB引擎自动为热点页构建哈希索引：

触发条件：连续访问相同页超过阈值
性能提升：等值查询速度提升2-10倍

监控方式：

SHOW ENGINE INNODB STATUS\G
-- 查看Adaptive Hash Index相关统计

10. 倒排索引实现方案

全文检索场景下，可采用：

原生FULLTEXT索引：适合简单文本搜索
第三方解决方案：Elasticsearch等专用搜索引擎
混合架构：数据库存储结构化数据，搜索引擎处理文本检索

五、索引监控与调优

11. 慢查询日志分析

通过慢查询日志定位性能瓶颈：

-- 开启慢查询日志
SET GLOBAL slow_query_log = 'ON';
SET GLOBAL long_query_time = 1; -- 设置阈值(秒)

分析工具：

mysqldumpslow：官方工具
pt-query-digest：Percona工具包
云数据库监控：如日志服务集成分析

12. EXPLAIN深度解读

掌握EXPLAIN输出关键字段：

type列：system>const>eq_ref>ref>range>index>ALL
key列：实际使用的索引
rows列：预估扫描行数
Extra列：Using index(覆盖索引)/Using where(回表)/Using temporary(临时表)

13. 索引统计信息更新

ANALYZE TABLE更新统计信息：

ANALYZE TABLE orders; -- 适用于数据量变化大的表

自动更新机制：

innodb_stats_persistent：持久化统计信息
innodb_stats_auto_recalc：自动重计算开关

六、实战案例分析

14. 大表分页优化

传统LIMIT offset,size性能问题：

-- 低效方案
SELECT * FROM large_table ORDER BY id LIMIT 100000, 10;
-- 优化方案：使用索引覆盖+子查询
SELECT * FROM large_table 
WHERE id >= (SELECT id FROM large_table ORDER BY id LIMIT 100000, 1) 
LIMIT 10;

15. 订单状态查询优化

高频状态查询场景：

-- 原始方案：单列索引
CREATE INDEX idx_status ON orders(status);
-- 优化方案：复合索引+覆盖索引
CREATE INDEX idx_status_time ON orders(status, create_time);
SELECT status, COUNT(*) FROM orders 
WHERE status IN ('paid','shipped') 
GROUP BY status;

16. 联合索引与排序优化

混合查询与排序场景：

-- 原始查询
SELECT * FROM products 
WHERE category_id = 5 
ORDER BY price DESC 
LIMIT 100;
-- 优化方案
CREATE INDEX idx_category_price ON products(category_id, price DESC);

七、索引设计最佳实践

17. 索引设计黄金法则

遵循5W原则：Where/Group By/Order By/Join/覆盖字段
控制索引数量：建议单表不超过6个索引
定期重构索引：删除冗余索引，合并相似索引
考虑读写比例：读多写少场景可适当增加索引

18. 新架构索引策略

分布式数据库环境下：

分片键选择：确保查询能路由到单个分片
全局索引：跨分片查询的权衡方案
本地索引：分片内查询的优化手段

通过系统掌握这些索引技术，开发者不仅能从容应对面试中的各种问题，更能在实际项目中构建高性能的数据库系统。建议结合具体业务场景进行实践验证，持续优化索引策略。

MySQL索引面试通关指南：18个高频问题深度解析