一、联合查询技术概述

联合查询是数据库操作中实现多数据集纵向合并的核心技术，通过UNION或UNION ALL运算符将多个SELECT语句的结果集整合为统一输出。其本质是将结构相似的数据表或查询结果进行叠加，形成包含所有记录的完整数据视图。

该技术广泛应用于数据仓库、报表系统及ETL流程中，典型应用场景包括：

跨分片数据聚合：将分布式数据库中分散存储的同类数据合并分析
多维度数据整合：组合不同查询条件下的业务指标进行综合分析
历史数据对比：将当前周期数据与历史同期数据进行并排展示

在技术实现层面，联合查询要求参与合并的查询必须满足三个基本条件：

列数严格一致
对应列数据类型兼容（系统自动完成类型转换）
列顺序保持相同

二、UNION与UNION ALL的核心差异

1. 结果集处理机制

UNION：执行隐式去重操作，通过排序和比较消除重复行，生成唯一结果集
UNION ALL：保留所有记录，包括完全相同的重复行，不进行任何去重处理

2. 性能对比分析

操作类型	执行复杂度	内存消耗	适用场景
UNION	O(n log n)	高	需要精确统计的场景
UNION ALL	O(n)	低	大数据量聚合场景

在处理百万级数据时，UNION ALL的性能优势可达3-5倍，特别适合日志分析、监控数据聚合等不需要去重的场景。

3. 语法规范示例

-- 基本语法结构
SELECT column1, column2 FROM table1
UNION [ALL]
SELECT column1, column2 FROM table2;
-- 实际案例：合并不同地区的销售数据
SELECT product_id, SUM(sales) as total_sales 
FROM east_region_sales 
GROUP BY product_id
UNION ALL
SELECT product_id, SUM(sales) as total_sales 
FROM west_region_sales 
GROUP BY product_id;

三、高级应用技巧

1. 列标题定义规则

结果集的列名始终采用第一个SELECT语句的列名，后续查询的列别名将被忽略。可通过以下方式优化显示：

SELECT product_id as id, product_name as name FROM products
UNION
SELECT sku_id, sku_description FROM skus;  -- 第二列显示为name而非sku_description

2. 执行顺序控制

通过括号明确优先级，构建复杂查询逻辑：

-- 先合并A和B，再与C合并
(SELECT * FROM tableA UNION SELECT * FROM tableB)
UNION ALL
SELECT * FROM tableC;

3. 排序处理规范

排序操作必须引用首个查询的列名，且作用于最终合并结果：

SELECT employee_id, salary FROM hr_east
UNION
SELECT staff_id, wage FROM hr_west
ORDER BY employee_id;  -- 必须使用首个查询的列名

4. 数据类型转换机制

系统自动执行隐式类型转换，遵循以下优先级：

CHAR → VARCHAR → TEXT → 
NUMERIC → DECIMAL → FLOAT → DOUBLE → 
DATE → TIMESTAMP → DATETIME

开发者可通过CAST函数显式控制转换过程：

SELECT CAST(id AS VARCHAR) as str_id FROM table1
UNION
SELECT employee_code FROM table2;

四、性能优化策略

1. 索引利用建议

对参与合并的查询条件列建立索引
避免在合并后结果集上使用ORDER BY，改在子查询中处理
大数据量场景优先使用UNION ALL

2. 查询重构技巧

将复杂联合查询拆分为临时表或CTE（Common Table Expression）：

WITH regional_sales AS (
    SELECT region, product, amount FROM sales_east
    UNION ALL
    SELECT region, product, amount FROM sales_west
)
SELECT product, SUM(amount) FROM regional_sales GROUP BY product;

3. 资源消耗监控

通过执行计划分析工具识别性能瓶颈，重点关注：

全表扫描次数
临时表使用情况
排序操作开销

五、典型应用场景

1. 多数据源整合

某电商平台需要合并MySQL主库和Redis缓存中的商品信息：

SELECT id, name, price FROM mysql_products
UNION
SELECT item_id, item_name, cached_price FROM redis_items;

2. 异构系统数据同步

将Oracle业务系统的订单数据与MySQL风控系统的审核记录合并分析：

SELECT order_id, customer_id, amount FROM oracle_orders
UNION ALL
SELECT ref_no, user_id, 0 as amount FROM mysql_audits;

3. 实时报表生成

构建包含当前数据与历史数据的对比报表：

-- 当前月数据
SELECT 'current' as period, product, sales 
FROM monthly_sales 
WHERE month = CURRENT_MONTH
UNION ALL
-- 历史同期数据
SELECT 'historical' as period, product, sales 
FROM monthly_sales_archive 
WHERE month = SAME_MONTH_LAST_YEAR;

六、常见问题处理

1. 列数不匹配错误

错误示例：

SELECT id, name FROM users
UNION
SELECT username FROM admins;  -- 列数不一致

解决方案：补充NULL值占位

SELECT id, name FROM users
UNION
SELECT NULL as id, username FROM admins;

2. 数据类型冲突