一、INSERT语句的完整语法解析

PostgreSQL的INSERT语句作为数据写入的核心指令，其语法设计兼顾灵活性与功能性。根据最新文档规范，完整语法结构可分解为六大模块：

[WITH [RECURSIVE] with_query [, ...]]  -- CTE预处理
INSERT INTO table_name [AS alias]       -- 目标表声明
[(column_name [, ...])]                -- 列指定
[OVERRIDING {SYSTEM|USER} VALUE]       -- 序列覆盖
{DEFAULT VALUES | VALUES(...) | query} -- 数据源
[ON CONFLICT ...]                      -- 冲突处理
[RETURNING ...]                        -- 结果返回

每个模块均包含关键技术点：

CTE预处理：通过WITH子句实现复杂查询的模块化，支持递归查询处理层级数据
列指定：显式声明列名可避免表结构变更导致的兼容性问题
序列覆盖：OVERRIDING SYSTEM VALUE用于重置自增序列的当前值
数据源：支持三种数据来源方式，其中query方式可实现跨表数据迁移
冲突处理：ON CONFLICT子句实现UPSERT功能，避免先查询后插入的竞态条件
结果返回：RETURNING子句可获取插入后的数据状态，减少二次查询

二、批量插入技术实践

2.1 单条插入的两种模式

基础插入操作包含全列插入和部分列插入两种模式：

-- 全列插入（需保持顺序一致）
INSERT INTO products VALUES('P1001', 'Laptop', 999.99, 50);
-- 部分列插入（未指定列使用默认值）
INSERT INTO products(product_id, name, price) 
VALUES('P1002', 'Smartphone', 699.99);

2.2 多行批量插入优化

批量插入通过单语句传输多行数据，相比多次单条插入具有显著性能优势：

-- 标准批量插入语法
INSERT INTO products(product_id, name, price, stock)
VALUES 
    ('P1003', 'Tablet', 399.99, 100),
    ('P1004', 'Monitor', 249.99, 75),
    ('P1005', 'Keyboard', 49.99, 200);

性能对比测试显示：

1000行数据插入时，批量操作比单条循环快15-20倍
网络延迟越高，批量操作的优势越明显
事务开销固定，批量操作减少事务提交次数

2.3 默认值处理策略

对于需要使用默认值的场景，PostgreSQL提供三种实现方式：

-- 方式1：全列默认
INSERT INTO products DEFAULT VALUES;
-- 方式2：显式DEFAULT关键字
INSERT INTO products(product_id, create_time) 
VALUES('P1006', DEFAULT);
-- 方式3：列定义默认值（无需INSERT时指定）
CREATE TABLE products (
    product_id TEXT PRIMARY KEY,
    create_time TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);

三、冲突处理机制详解

3.1 唯一约束冲突处理

当插入数据违反唯一约束时，ON CONFLICT子句提供两种处理模式：

-- 模式1：冲突时忽略（INSERT IGNORE等效）
INSERT INTO users(user_id, email) 
VALUES('U1001', 'user@example.com')
ON CONFLICT(email) DO NOTHING;
-- 模式2：冲突时更新（ON DUPLICATE KEY UPDATE等效）
INSERT INTO users(user_id, email, login_count) 
VALUES('U1001', 'user@example.com', 1)
ON CONFLICT(email) DO UPDATE 
SET login_count = users.login_count + 1;

3.2 冲突目标指定

可通过两种方式指定冲突检测目标：

-- 1. 指定约束名称（需提前知晓约束名）
ON CONFLICT ON CONSTRAINT user_email_key DO UPDATE ...
-- 2. 指定列名（更常用的方式）
ON CONFLICT(email) DO UPDATE ...

3.3 条件冲突处理

PostgreSQL支持基于条件的冲突处理，实现更复杂的业务逻辑：

INSERT INTO orders(order_id, user_id, status)
VALUES('O1001', 'U1001', 'pending')
ON CONFLICT(order_id) DO UPDATE 
SET status = CASE 
    WHEN EXCLUDED.status = 'cancelled' THEN 'cancelled'
    ELSE orders.status 
END;

四、自增ID获取技术

4.1 序列操作基础

PostgreSQL使用序列对象实现自增ID：

-- 创建序列
CREATE SEQUENCE product_id_seq;
-- 使用序列值
INSERT INTO products(product_id, name)
VALUES(nextval('product_id_seq'), 'New Product');
-- 修改序列当前值
ALTER SEQUENCE product_id_seq RESTART WITH 1000;

4.2 RETURNING子句应用

通过RETURNING子句可直接获取插入后的自增ID，避免二次查询：

-- 插入并返回完整记录
INSERT INTO products(name, price)
VALUES('Wireless Earbuds', 129.99)
RETURNING *;
-- 仅返回自增ID
INSERT INTO products(name, price)
VALUES('Smart Watch', 199.99)
RETURNING product_id;

4.3 批量插入的ID获取

对于批量插入场景，RETURNING可返回所有新生成的ID：

-- 批量插入并获取所有ID
INSERT INTO products(name, price)
VALUES 
    ('Bluetooth Speaker', 89.99),
    ('Power Bank', 49.99),
    ('USB Cable', 12.99)
RETURNING product_id;

五、高级应用场景

5.1 数据迁移优化

使用INSERT…SELECT实现高效数据迁移：

-- 从临时表迁移数据
INSERT INTO production.products
SELECT * FROM staging.products_temp
ON CONFLICT(product_code) DO UPDATE 
SET price = EXCLUDED.price;

5.2 JSON数据插入

PostgreSQL支持直接插入JSON格式数据：

-- 插入JSON对象
INSERT INTO product_attributes(product_id, attributes)
VALUES('P1001', '{"color": "black", "size": "XL"}'::jsonb);
-- 插入JSON数组
INSERT INTO product_images(product_id, image_urls)
VALUES('P1001', '["url1.jpg", "url2.jpg"]'::jsonb);

5.3 事务控制最佳实践

结合事务实现批量插入的原子性：

BEGIN;
INSERT INTO order_items(order_id, product_id, quantity)
VALUES 
    ('O1001', 'P1001', 2),
    ('O1001', 'P1002', 1);
UPDATE products 
SET stock = stock - t.qty
FROM (
    SELECT product_id, SUM(quantity) as qty 
    FROM order_items 
    WHERE order_id = 'O1001' 
    GROUP BY product_id
) as t
WHERE products.product_id = t.product_id;
COMMIT;

六、性能优化建议

批量大小控制：建议每批次100-1000行，根据网络延迟调整
事务拆分：超大数据量分多个事务提交
索引优化：批量插入前可暂时禁用非关键索引
并发控制：高并发场景使用 advisory locks 避免冲突
预处理语句：使用PREPARE减少SQL解析开销

通过掌握这些高级插入技术，开发者可以显著提升PostgreSQL数据写入的效率和可靠性，特别是在处理大规模数据迁移、高并发写入等复杂场景时，这些技巧将发挥关键作用。

PostgreSQL高效数据插入：批量、冲突与自增ID全解析