如何避免MySQL锁带来的性能问题

2025-06-07

以下内容将围绕在实际项目中常见的 MySQL 锁所带来的性能问题，从底层原理、典型场景入手，结合代码示例、ASCII 图解和详细说明，并给出一系列实用的优化策略，帮助你在日常开发和运维中避开锁冲突、降低锁等待、提升并发性能。

1. 概述：MySQL 锁“坏朋友”与性能挑战

在 MySQL（以 InnoDB 引擎为例）中，为了保证事务的 ACID 特性，会对数据行或表加锁。常见锁类型包括：

记录锁（Record Lock）：针对索引上的单行数据加锁。
间隙锁（Gap Lock）：锁定索引记录之间的空隙，用于防止幻读。
临键锁（Next-key Lock）：记录锁 + 左侧间隙锁，用于在 REPEATABLE READ 隔离级别下防止幻读。
意向锁（Intention Lock）：在表级做标记，表示事务想要对表中某行加行锁。

由于并发场景下锁会串行化对同一资源的访问，一旦锁竞争激烈，就会带来锁等待、死锁、甚至吞吐量下降等一系列性能问题。

性能痛点总结
长事务持锁：拖慢后续事务，导致大量锁等待。
范围查询锁住大范围行：使用 FOR UPDATE 或大范围 UPDATE 时加了大量“临键锁/间隙锁”，阻塞其他插入或更新。
索引缺失导致全表锁或大范围锁：无索引或错误索引走全表扫描，锁范围放大。
隔离级别过高（如 REPEATABLE READ）：会加更多的间隙锁，导致写操作冲突。
死锁回滚开销：大量死锁导致事务不断被系统回滚、应用重试，严重浪费资源。

接下来，我们通过几个典型示例，分析锁冲突的具体成因，并给出对应的优化方案。

2. 常见锁冲突“重现”：代码演示与分析

下面通过一个最常见的“行锁冲突”场景，演示锁等待对性能的影响。

2.1 示例表与初始数据

-- 示例数据库与表结构（InnoDB 引擎）
CREATE DATABASE IF NOT EXISTS lock_demo;
USE lock_demo;

DROP TABLE IF EXISTS orders;
CREATE TABLE orders (
    id        INT        PRIMARY KEY AUTO_INCREMENT,
    user_id   INT        NOT NULL,
    status    VARCHAR(20) NOT NULL,
    amount    DECIMAL(10,2),
    INDEX idx_user_status(user_id, status)
) ENGINE=InnoDB;

-- 插入 3 行样本数据
INSERT INTO orders (user_id, status, amount) VALUES
(100, 'pending',  99.99),
(100, 'shipped', 199.00),
(200, 'pending',  49.50);

此时 orders 表中共有三条订单记录，主键为 id，并在 (user_id, status) 上建立了复合索引。

2.2 场景：两会话并发更新相同 `user_id` 记录

会话 A（Session A）：

-- 会话 A
USE lock_demo;
START TRANSACTION;

-- Step A1：锁定 user_id=100 且 status='pending' 的行
SELECT * FROM orders
 WHERE user_id = 100 AND status = 'pending'
 FOR UPDATE;     -- 加上记录锁与临键锁
-- 这里会锁定 id=1 这一行（记录锁），并锁定 (user_id=100,status='pending') 对应的索引项。

会话 A 此时持有对 (user_id=100,status='pending') 的记录锁。
下游若要修改这行或对相同索引范围插入，都将被阻塞。

会话 B（Session B）：

-- 会话 B，不同终端
USE lock_demo;
START TRANSACTION;

-- Step B1：尝试更新相同条件的行
UPDATE orders
   SET amount = amount + 10
 WHERE user_id = 100 AND status = 'pending';
-- 由于 A 已经对该行加了记录锁，B 会在此处阻塞等待 A 提交或回滚。

此时会话 B 阻塞，直到 A 执行 COMMIT 或 ROLLBACK。如果 A 的事务逻辑很长（如在应用中有复杂计算或业务操作），B 可能长时间处于等待状态，造成延迟和吞吐率下降。

ASCII 图解：“行锁冲突”示意

Session A:                      Session B:
-----------                     -----------
START TRANSACTION;              START TRANSACTION;
SELECT ... FOR UPDATE   ──┐     UPDATE ...         ──┐
(锁定 idx_user_status)    │     (等待锁释放)       │
                          │                       │
-- 记录锁: orders.id=1 -- │                       │
(持有至 COMMIT)           │                       │
                          │                       │
                          └───────────────────────>│
                                                  │
-- 会话 B 阻塞在此处 -------------------------------┘

如果 A 事务持续时间很长，B 会一直在等待，严重时会导致应用线程阻塞积压。

3. 避免策略一：缩短事务时间与锁持有周期

3.1 原因

事务开启后，只要没提交（COMMIT）或回滚（ROLLBACK），InnoDB 持有的锁就不会释放。长事务在并发场景下最容易引发锁等待或死锁。

3.2 优化思路

只在必要时开启事务
- 在可拆分的业务逻辑中，尽量先做不需要锁的读操作，等到需要写时再开启事务。
事务逻辑尽量精简
- 避免在事务中进行用户交互、耗时计算、网络调用。
提前获取锁，快速执行数据库操作后立即提交
- 如果需要锁定行做一系列读取+判断+写操作，尽量在获取到锁后，马上完成相关 SQL 并提交，减少锁持有时间。

3.3 代码示例：对比“长事务”与“短事务”

不佳做法：长事务（容易造成锁等待）

-- 会话 A
USE lock_demo;
START TRANSACTION;

-- Step 1：查询业务数据
SELECT * FROM orders WHERE user_id=200 AND status='pending' FOR UPDATE;
-- (假设下游要调用远程接口或做大量计算)
-- ↓ 这里假装睡眠 10 秒，模拟复杂业务逻辑
SELECT SLEEP(10);

-- Step 2：更新数据
UPDATE orders
   SET status = 'completed'
 WHERE user_id = 200 AND status = 'pending';

COMMIT;

在 SLEEP(10) 期间，事务一直未提交，会阻塞其他对 user_id=200、status='pending' 相关的更新或插入。

改进做法：短事务（锁持有时间极短）

-- 会话 A
USE lock_demo;

-- Step 1：先进行不需锁的业务逻辑（如缓存读取、验证等）
-- （此时不在事务中，可并发执行，不影响其他人）

-- Step 2：真正需要更新时，才开启事务并快速提交
START TRANSACTION;
  -- 仅获取锁和更新操作
  SELECT * FROM orders WHERE user_id=200 AND status='pending' FOR UPDATE;
  UPDATE orders
     SET status = 'completed'
   WHERE user_id = 200 AND status = 'pending';
COMMIT;

此时“锁定→更新→提交”仅需要非常短时间，不会长时间阻塞其他事务。

4. 避免策略二：合理使用索引，避免全表扫描带来的大范围锁

4.1 原因

在 InnoDB 中，如果 WHERE 条件未命中索引，MySQL 可能进行全表扫描，会为每行加“临键锁/间隙锁”或隐式升级为“行锁→表锁”，导致锁范围非常大。
此时即使只想更新一两行，也会阻塞整张表的大批并发操作。

4.2 优化思路

为常用查询列创建合适的索引，让 InnoDB 精确定位要更新的记录。
审查慢查询日志，发现高耗时的 UPDATE/DELETE 语句，对应的 EXPLAIN 看有没有走索引。
避免在 WHERE 中对索引列进行函数运算或隐式类型转换，否则索引失效。

4.3 代码示例：索引 vs 无索引

假设我们想删除 status='canceled' 的所有老订单。

情况 A：无索引，导致全表扫描

-- 假设 orders 表没有索引在 status 上
EXPLAIN DELETE FROM orders WHERE status='canceled';

+----+-------------+--------+------------+------+---------------+------+---------+------+-------+----------+-------+
| id | select_type | table  | partitions | type | possible_keys | key  | key_len | ref  | rows  | filtered | Extra |
+----+-------------+--------+------------+------+---------------+------+---------+------+-------+----------+-------+
|  1 | DELETE      | orders | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 10000 |     10.00 | Using where |
+----+-------------+--------+------------+------+---------------+------+---------+------+-------+----------+-------+

type=ALL 表示全表扫描，其中 InnoDB 会对大范围行加“行锁”或“临键锁”，阻塞其它并发写。

情况 B：为 `status` 建立索引

ALTER TABLE orders ADD INDEX idx_status(status);

EXPLAIN DELETE FROM orders WHERE status='canceled';

+----+-------------+--------+------------+------+---------------+-----------+---------+-------+------+----------+-------+
| id | select_type | table  | partitions | type | possible_keys | key       | key_len | ref   | rows | filtered | Extra |
+----+-------------+--------+------------+------+---------------+-----------+---------+-------+------+----------+-------+
|  1 | DELETE      | orders | NULL       | ref  | idx_status    | idx_status| 22      | const | 100  |   100.00 |       |
+----+-------------+--------+------------+------+---------------+-----------+---------+-------+------+----------+-------+

type=ref 表示通过索引定位要删除的那 100 条行，只锁住这 100 行，不会锁住全表，极大减少锁冲突面。

5. 避免策略三：选择合适的隔离级别，减少“临键锁”带来的额外阻塞

5.1 BBarrier：隔离级别对锁行为的影响

隔离级别	主要特点	锁行为示例
READ UNCOMMITTED	允许脏读，极少行锁	SELECT … FOR UPDATE 会加记录锁，但普通读不加任何锁。
READ COMMITTED	只读取已提交数据，无幻读保障；每次查询都取最新数据	SELECT … FOR UPDATE 仅加记录锁，无临键锁，不锁范围之间的“间隙”。
REPEATABLE READ (默认)	保证同一事务内多次读取结果一致，防止幻读	SELECT … FOR UPDATE 加记录锁＋间隙锁，即“临键锁”，可产生较多范围锁。
SERIALIZABLE	提供完全串行化读写，性能最差	常用的 SELECT 会加 S-lock，基本所有读写会串行化，极易阻塞并发查询。

REPEATABLE READ 在 InnoDB 中，会对范围扫描的表加“临键锁”，防止幻读，但也带来更多写冲突。
如果业务允许“幻读”出现，可以将隔离级别调整为 READ COMMITTED，这样 InnoDB 对范围查询仅加记录锁，不加间隙锁，减少锁冲突。

5.2 代码示例：对比 REPEATABLE READ vs READ COMMITTED

5.2.1 REPEATABLE READ 下范围查询加临键锁

-- 会话 A
SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ;
START TRANSACTION;
SELECT * FROM orders WHERE user_id BETWEEN 100 AND 200 FOR UPDATE;
-- 此时对 user_id=100、200 及 (100,200) 间隙加“临键锁”。
-- 会阻塞其他并发插入 user_id=150 的操作。

-- 会话 B
SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ;
START TRANSACTION;
INSERT INTO orders (user_id,status,amount) VALUES (150,'pending',120.00);
-- B 在 (100,200) 区间插入，要等待 A 提交或回滚。

5.2.2 READ COMMITTED 下仅加记录锁

-- 会话 A
SET SESSION TRANSACTION ISOLATION LEVEL READ COMMITTED;
START TRANSACTION;
SELECT * FROM orders WHERE user_id BETWEEN 100 AND 200 FOR UPDATE;
-- 仅锁住满足条件的现有行，比如 id=1、2，(100,200) 区间不加临键锁。
-- 允许其他人在 (100,200) 区间插入新行。

-- 会话 B
SET SESSION TRANSACTION ISOLATION LEVEL READ COMMITTED;
START TRANSACTION;
INSERT INTO orders (user_id,status,amount) VALUES (150,'pending',120.00);
-- 可以立即插入，因为 A 只锁了现有行，不锁间隙。

提示：切换隔离级别仅对当前会话生效，可通过程序在必要时动态调整。若全局改为 READ COMMITTED，要评估应用中是否依赖于 REPEATABLE READ 的幻读隔离保证。

6. 避免策略四：尽量使用乐观锁，减少悲观锁带来的锁等待

6.1 悲观锁 vs 乐观锁

悲观锁：通过显式 SELECT … FOR UPDATE、UPDATE、DELETE 等操作，让数据库层面加锁，确保修改不会被并发事务冲突。
乐观锁：不在数据库层面加锁，而是通过在行中维护版本号（或时间戳）字段，在更新时检查版本是否一致，若不一致则说明有并发更新冲突，需要重试或报错。

乐观锁适用于冲突概率较低、读多写少的场景，可以极大减少锁等待。

6.2 代码示例：使用版本号实现乐观锁

表结构：增加 `version` 列

ALTER TABLE orders 
  ADD COLUMN version INT NOT NULL DEFAULT 1;

A. 悲观锁示例

-- 会话 A：悲观锁
START TRANSACTION;
SELECT * FROM orders WHERE id = 1 FOR UPDATE;
-- 修改
UPDATE orders
   SET amount = amount + 10
 WHERE id = 1;
COMMIT;

此时其他事务在更新 id=1 前都会阻塞等待。

B. 乐观锁示例

读取数据并获取版本号

-- 会话 A
START TRANSACTION;
SELECT amount, version FROM orders WHERE id = 1;
-- 假设返回 amount=100, version=1

业务层计算新值，然后尝试更新时加上 WHERE version=?
```
-- 会话 A 计算出 new_amount=110, old_version=1
UPDATE orders
   SET amount = 110,
       version = version + 1
 WHERE id = 1 AND version = 1;
```
- 如果执行成功（影响行数 = 1），说明无并发冲突，可以 COMMIT。
- 如果执行影响行数 = 0，说明有人在此期间修改了该行，版本号已变；则抛出冲突异常，进行业务层重试或返回错误。
提交事务
```
COMMIT;
```

由于没有显式行锁，如果并发非常低，就不会产生任何锁等待；只有在真正冲突时，才回退一条更新并重试。

注意：乐观锁适合写少读多、低冲突场景。如果并发写冲突概率很高，可能频繁重试，反而降低性能；需要根据业务特点选择合适方案。

7. 避免策略五：批量操作拆分、分页更新或分区表减少锁冲突

7.1 原因

批量更新或删除大数据量时，MySQL 会一次性扫描并加锁大量行，导致其他事务长时间等待。
此时可以将大事务拆分成多个小批次来执行，每批只加锁一部分数据。

7.2 优化思路

分批分页更新
- 例如想把 status='pending' 的 100 万行订单都标记为 status='completed'，不要一次性 UPDATE orders SET status='completed' WHERE status='pending';
- 而应该用循环分页的方式，分批量小范围 UPDATE，每批执行完可使锁更快释放给其他事务。
分区表
- 根据某些列（如日期、用户 ID 等）做分区，让查询和更新只锁某个分区，减少对全表的锁冲突。

7.3 代码示例：分批分页更新

假设要将 status='pending' 的记录疫情批量更新为 status='completed'，每次处理 1000 条。

-- 步骤 A：获取总计待处理行数
SELECT COUNT(*) AS cnt FROM orders WHERE status='pending';

-- 步骤 B：分批处理
-- 在应用层用循环或脚本模拟
SET @batch_size = 1000;
SET @offset = 0;

-- 伪代码循环逻辑（可用存储过程或应用脚本实现）
-- while true:
--   rows = SELECT id FROM orders WHERE status='pending' LIMIT @offset, @batch_size;
--   if rows is empty: break
--   START TRANSACTION;
--     UPDATE orders
--       SET status = 'completed'
--     WHERE id IN (rows);
--   COMMIT;
--   SET @offset = @offset + @batch_size;
-- end while

每次只锁定 1000 条 id，马上提交后释放锁，让其他事务能插入、更新不相关 status 的行。

如果采用空分页 LIMIT @offset,@batch_size 随着 @offset 变大效率会大幅下降，可改为用“主键增量”方式分页：

-- 用上一轮更新的最大 id 作为游标，避免 OFFSET 大量跳过
SET @last_id = 0;
WHILE 1=1 DO
  SELECT id INTO @id_list
    FROM orders
   WHERE status='pending' AND id > @last_id
   ORDER BY id
   LIMIT @batch_size;
  IF @id_list IS NULL THEN
     LEAVE;
  END IF;
  -- 更新这批 id
  START TRANSACTION;
    UPDATE orders
       SET status='completed'
     WHERE id IN (@id_list);
  COMMIT;
  -- 取出本批最大 id
  SET @last_id = MAX(@id_list);
END WHILE;

7.4 代码示例：分区表减少锁范围

假设 orders 表按月做 RANGE 分区，以 order_date 为分区键（需先在表中加 order_date 字段，以下仅示例分区语法）：

CREATE TABLE orders (
    id         INT        PRIMARY KEY AUTO_INCREMENT,
    user_id    INT        NOT NULL,
    status     VARCHAR(20) NOT NULL,
    amount     DECIMAL(10,2),
    order_date DATE       NOT NULL,
    INDEX idx_user_status(user_id, status),
    INDEX idx_date(order_date)
) ENGINE=InnoDB
PARTITION BY RANGE( YEAR(order_date) ) (
    PARTITION p2019 VALUES LESS THAN (2020),
    PARTITION p2020 VALUES LESS THAN (2021),
    PARTITION p2021 VALUES LESS THAN (2022),
    PARTITION pmax  VALUES LESS THAN MAXVALUE
);

当执行 UPDATE orders SET status='expired' WHERE order_date BETWEEN '2021-01-01' AND '2021-12-31'; 时，仅锁 p2021 分区中的行，不会触及 p2019、p2020 等。
极大减少锁冲突面，其他分区的并发操作不会阻塞。

8. 监控与诊断：及时发现锁等待与死锁

8.1 SHOW ENGINE INNODB STATUS 用法

SHOW ENGINE INNODB STATUS\G

查看输出中的 LATEST DETECTED DEADLOCK 段，可定位最近一次死锁的详细信息，包括哪些事务、哪些锁、SQL 语句等。
在 TRANSACTIONS 段中可看到当前正在等待的锁、锁持有者、等待时间等信息。

8.2 performance\_schema 和 INFORMATION\_SCHEMA

INFORMATION\_SCHEMA.INNODB\_LOCKS：当前 InnoDB 锁清单，包含锁类型、表、索引、锁模式等。
INFORMATION\_SCHEMA.INNODB\_LOCK\_WAITS：当前锁等待图，表示哪个事务在等待哪个锁。

-- 查看当前所有锁
SELECT * FROM information_schema.INNODB_LOCKS\G

-- 查看锁等待关系
SELECT * FROM information_schema.INNODB_LOCK_WAITS\G

将这些信息与 performance_schema 中的线程、事务信息结合，可绘制出当前锁等待链，帮助快速定位冲突热点。

8.3 查询锁等待次数与死锁总数

-- 查看系统累计死锁次数
SHOW GLOBAL STATUS LIKE 'Innodb_deadlocks';
-- 查看当前锁等待次数
SHOW GLOBAL STATUS LIKE 'Innodb_row_lock_waits';

如果 Innodb_deadlocks 数值持续上升，说明系统中死锁频繁，应结合应用逻辑和索引设计进行排查。
Innodb_row_lock_waits 代表因行锁等待导致的睡眠次数，可作为锁冲突的指标。

9. 小结与最佳实践清单

9.1 核心结论

锁是一把双刃剑：保证数据一致性与隔离性的同时，也会对并发性能带来成本。
长事务与大范围查询 是锁争用和死锁的主要“罪魁祸首”。
合理索引、短事务、合适隔离级别、乐观锁、分批分区 等是避开锁性能问题的主流手段。
监控与诊断 是保证数据库健康的常态化运维操作，及时发现锁等待和死锁才能快速定位并优化。

9.2 实用优化要点清单

缩短事务生命周期
- 事务中只包含必要的读写操作，尽快提交，避免长时间持锁。
使用合适的隔离级别
- 如果业务允许，可将全局或会话隔离级别设置为 READ COMMITTED，减少临键锁产生。
确保查询走索引
- 针对高并发的 UPDATE/DELETE/SELECT … FOR UPDATE，需要为 WHERE 条件列建立合适索引，避免全表扫描。
分批处理大事务
- 对大数据量更新/删除，采用分页或主键范围分批执行，减少单次锁住的行数。
使用乐观锁
- 在冲突概率较低的场景中，用版本号（version）或时间戳字段做乐观锁，避免行锁等待。
分区表/分库分表
- 对于数据量和并发非常大的表，考虑垂直/水平拆分，或者使用表分区，让锁只作用在小范围。
避免范围扫描加大范围锁
- 如果确实要做范围更新，先查出行主键再通过主键批量更新；或者将查询条件拆分成多个小范围。
监控锁等待与死锁
- 定期检查 SHOW ENGINE INNODB STATUS、INFORMATION_SCHEMA.INNODB_LOCK_WAITS、Innodb_deadlocks 等，发现热点及时优化。

通过上述详尽示例与代码对比，你应能清晰理解 MySQL 锁带来的性能问题背后“锁粒度”、“锁范围”与“事务时间”三者之间的关系，并掌握常见的预防策略。在实际项目中，结合业务场景选择最合适的隔离级别与锁方案，及时监控并逐步优化，才能让数据库在高并发环境下既保证数据安全，又拥有良好吞吐。

- 阅读更多 -

MySQL锁机制中的死锁是如何产生的

System

2025-06-07

所有,mysql,数据库

以下内容将从死锁的基本概念入手，结合 MySQL InnoDB 行级锁的工作原理，通过具体的代码示例、ASCII 图解和详细说明，帮助你系统地理解 MySQL 锁机制中的死锁是如何产生的，以及如何检测和解决死锁。

1. 什么是死锁

死锁（Deadlock）：指在并发环境下，多个事务各自持有部分资源并相互等待对方释放资源，从而形成无限等待的状态，导致无法继续执行。
在 MySQL InnoDB 引擎中，资源通常是某些行级锁、间隙锁或表锁。当事务 A 持有资源 R1，等待资源 R2；同时事务 B 持有资源 R2，等待资源 R1，就形成了最典型的死锁。

1.1 死锁与普通锁等待的区别

普通锁等待：事务 A 请求锁时，如果资源正在被事务 B 持有，A 会挂起等待，直到 B 提交/回滚并释放锁。等待过程可被唤醒继续执行。
死锁：如果等待关系形成环（环路），例如 A 等待 B，B 又等待 A，两者都永远得不到所需资源，系统就无法继续。InnoDB 会检测到这种环路后，选择其中一个事务回滚，从而解除死锁。

2. InnoDB 中的锁类型概览

在分析死锁形成前，先简单回顾 InnoDB 常见锁类型：

记录锁（Record Lock）
- 作用于索引上的单条记录，用来防止并发修改同一行。
间隙锁（Gap Lock）
- 锁定索引值之间的空隙，阻止其他事务向间隙中插入新行，用于防止“幻读”。
临键锁（Next-key Lock）
- 记录锁 + 间隙锁，既锁住记录，也锁住它左侧的间隙，用于 REPEATABLE READ 隔离下防止幻读。
意向锁（Intention Lock）
- 用于表级上标记“此事务意向在表的某个行上加共享锁（IS）或排他锁（IX）”，便于上层快速检测冲突。

死锁往往由多个事务对同一个或多个行 (或间隙) 以不一致顺序地加锁所引起。下面通过示例演示最常见的两种死锁场景。

3. 示例一：两条记录互相更新导致死锁

3.1 场景描述

假设有一张 InnoDB 表 accounts，用于模拟两个账户之间转账场景。表结构与初始数据如下：

CREATE DATABASE IF NOT EXISTS test_deadlock;
USE test_deadlock;

CREATE TABLE accounts (
    id INT PRIMARY KEY,
    balance INT
) ENGINE=InnoDB;

INSERT INTO accounts (id, balance) VALUES
(1, 1000),
(2, 1000);

这时，假设有两个并发事务：

事务 A 想把账户 1 的 100 元转到账户 2；
事务 B 想把账户 2 的 200 元转到账户 1；

如果两者在不同会话中执行操作顺序不当，就可能产生死锁。

3.2 具体代码演示

以下演示在两个不同终端或会话中分别执行事务 A 和事务 B。

会话 A（终端 1）

-- 会话 A
USE test_deadlock;

START TRANSACTION;
-- Step A1: 锁定 accounts id=1 行
SELECT * FROM accounts WHERE id = 1 FOR UPDATE;
-- (模拟业务处理延迟)
-- DO SLEEP or 等待会话 B 先执行

-- Step A2: 尝试锁定 accounts id=2 行
UPDATE accounts SET balance = balance - 100 WHERE id = 1;
UPDATE accounts SET balance = balance + 100 WHERE id = 2;

COMMIT;

会话 B（终端 2）

-- 会话 B
USE test_deadlock;

START TRANSACTION;
-- Step B1: 锁定 accounts id=2 行
SELECT * FROM accounts WHERE id = 2 FOR UPDATE;
-- (模拟业务处理延迟)
-- DO SLEEP or 等待会话 A 已经执行第 A1 步

-- Step B2: 尝试锁定 accounts id=1 行
UPDATE accounts SET balance = balance - 200 WHERE id = 2;
UPDATE accounts SET balance = balance + 200 WHERE id = 1;

COMMIT;

并发执行顺序

会话 A 执行 SELECT * FROM accounts WHERE id = 1 FOR UPDATE;，锁住 id=1 的记录。
会话 B 执行 SELECT * FROM accounts WHERE id = 2 FOR UPDATE;，锁住 id=2 的记录。
会话 A 继续到 UPDATE ... WHERE id = 2;，此时需要锁住 id=2，但已被会话 B 锁住，A 被阻塞，等待 B 释放锁。
会话 B 继续到 UPDATE ... WHERE id = 1;，此时需要锁住 id=1，但已被会话 A 锁住，B 被阻塞，等待 A 释放锁。

此时 A 等待 B，B 等待 A，形成等待环，InnoDB 将检测到死锁。

3.3 ASCII 图解（记录锁交叉）

   +-------------------------+            +-------------------------+
   |        会话 A           |            |        会话 B           |
   |-------------------------|            |-------------------------|
   | START TRANSACTION;      |            | START TRANSACTION;      |
   | FOR UPDATE id=1 --------|------------>                         |
   | (锁住 Record(1) )       |            | FOR UPDATE id=2 --------|------------>
   |                         |            | (锁住 Record(2) )       |
   | 更新 id=1               |            |                         |
   | 尝试锁 id=2 <-----------|------------| UPDATE id=2             |
   |                         |            | 尝试锁 id=1 <-----------|
   +-------------------------+            +-------------------------+
          ↑等待 B释放 id=2                       ↑等待 A释放 id=1
          │                                         │
          └────────────── 死锁环路 ────────────────┘

Record(1) 和 Record(2) 分别表示两条记录的行锁。
互相等待对方持有的记录锁，从而形成死锁。

3.4 InnoDB 死锁检测与回滚

当 InnoDB 检测到这样的等待环时，会从以下两方面做处理：

选择牺牲者：InnoDB 会根据“回滚成本”（例如修改行数、加锁深度等），选择其中一个事务作为“死锁受害者”进行回滚（默认一般回滚后执行 SQL 的事务）。例如，可能是会话 B 被回滚。
通知客户端：被回滚的事务会返回类似如下错误：
```
ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction
```
应用收到后需要代码层面捕获此错误，并重试事务或采取补偿措施。

4. 示例二：基于范围查询的间隙锁死锁

除了记录锁互相等待，间隙锁与临键锁也可能导致死锁，尤其在多个事务对同一范围的插入/更新产生冲突时。下面演示一个“基于范围插入”的死锁场景。

4.1 场景描述

继续使用表 accounts，在表中只关注 id 列作索引。现在有两个事务：

事务 A 想插入 id=25；
事务 B 想插入 id=15；
但它们都使用 SELECT ... FOR UPDATE 预先锁定了一段范围，导致互相阻塞。

4.2 具体代码演示

会话 A（终端 1）

-- 会话 A
USE test_deadlock;
SET TRANSACTION ISOLATION LEVEL REPEATABLE READ;
START TRANSACTION;

-- A1: 对 id BETWEEN 20 AND 30 范围加临键锁
SELECT * FROM accounts WHERE id BETWEEN 20 AND 30 FOR UPDATE;
-- 锁定 id=20,30 记录及 (20,30) 间隙

-- A2: 尝试插入 id=25
INSERT INTO accounts (id,balance) VALUES (25, 500);
-- 会被阻塞，因 (20,30) 间隙已被锁定

会话 B（终端 2）

-- 会话 B
USE test_deadlock;
SET TRANSACTION ISOLATION LEVEL REPEATABLE READ;
START TRANSACTION;

-- B1: 对 id BETWEEN 10 AND 20 范围加临键锁
SELECT * FROM accounts WHERE id BETWEEN 10 AND 20 FOR UPDATE;
-- 锁定 id=10,20 记录及 (10,20) 间隙

-- B2: 尝试插入 id=15
INSERT INTO accounts (id,balance) VALUES (15, 700);
-- 会被阻塞，因 (10,20) 间隙已被锁定

并发执行顺序

会话 A 执行 SELECT ... WHERE id BETWEEN 20 AND 30 FOR UPDATE;
- 锁定 (20,30) 区间的间隙，以及边界记录 id=20、id=30。
会话 B 执行 SELECT ... WHERE id BETWEEN 10 AND 20 FOR UPDATE;
- 锁定 (10,20) 区间的间隙，以及边界记录 id=10（假设存在）和 id=20。此时 id=20 已被会话 A 锁定，会话 B 等待会话 A 释放 id=20 的记录锁。
会话 A 继续执行 INSERT INTO ... id=25，因 (20,30) 区间被会话 A 自己锁，但这里只是自己事务，不冲突；实际上插入也会请求 (20,30) 区间的插入许可，因它已经把 (20,30) 锁住，允许自己插入，所以 A 的 INSERT 可以执行成功。
- 插入完成后，A 执行 COMMIT，释放对 (20,30) 的锁。
会话 B 仍在等待 id=20 的记录锁，一旦 A 提交，B 获得 id=20 锁，然后尝试 INSERT id=15，此时 (10,20) 已被 B 自己锁，允许插入，继续执行成功。

注意：严格地说，此示例并未形成死锁环，因为会话 A 和会话 B 争用的资源并不完全互为环路。要演示真正的间隙锁死锁，需要双方同时持有对方欲插入区间的部分锁。下面再补充一个更典型的例子。

4.3 典型间隙锁死锁示例

假设初始表中有 id=10,30，我们准备两个事务，分别锁两个相邻区间再尝试插入对方区间的值，形成死锁。

初始数据

DELETE FROM accounts;
INSERT INTO accounts (id,balance) VALUES (10,1000),(30,1000);

此时，索引节点为：

10  (10,30)  30

会话 A

-- 会话 A
USE test_deadlock;
SET TRANSACTION ISOLATION LEVEL REPEATABLE READ;
START TRANSACTION;

-- A1: 锁定范围 (10,30)，即 SELECT id BETWEEN 10 AND 30
SELECT * FROM accounts WHERE id BETWEEN 10 AND 30 FOR UPDATE;
-- 会对 id=10,30 加记录锁，对 (10,30) 加间隙锁
-- 锁定如下：
-- [10:X]  [(10,30):LOCKED]  [30:X]

会话 B

-- 会话 B
USE test_deadlock;
SET TRANSACTION ISOLATION LEVEL REPEATABLE READ;
START TRANSACTION;

-- B1: 锁定范围 (10,30)，但使用反向范围，比如 id > 20 AND id < 40
SELECT * FROM accounts WHERE id > 20 AND id < 40 FOR UPDATE;
-- 会对 id=30 加记录锁，对 (20,30) 与 (30,40) 加间隙锁
-- 其中 (20,30) 属于 (10,30) 的子区间，会与 A 的间隙锁冲突吗？
-- 先看效果：B 尝试锁定时，发现 id=30 已被 A 锁住，B 等待

到此，B 已经无法获得对 id=30 的记录锁，需要等待 A 提交或回滚。

接着，A 尝试插入会话 B 想插入的记录：

-- 会话 A 继续
INSERT INTO accounts (id,balance) VALUES (20,500);
-- 由于 (10,30) 区间被 A 自己锁定，允许插入 20
-- 执行成功后，A 提交
COMMIT;

此时，B 获得 id=30 记录锁，再进入 INSERT 步骤：

-- 会话 B 继续
INSERT INTO accounts (id,balance) VALUES (25,400);
-- B 已锁定 (20,30) 区间，允许插入 25
COMMIT;

依然没有死锁。要让死锁真正形成，需要两个事务同时锁定相互重叠、但方向相反的区间，并都在等待对方锁释放。以下是一个可以复现间隙锁死锁的更精确示例：

会话 A（典型死锁版）

-- 会话 A
USE test_deadlock;
SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ;
START TRANSACTION;

-- A1: 锁定 id BETWEEN 10 AND 20（虽然 id=20 不存在，仍会对间隙 (10,20) 加锁）
SELECT * FROM accounts WHERE id BETWEEN 10 AND 20 FOR UPDATE;
-- 锁定 (10,20) 区间

会话 B

-- 会话 B
USE test_deadlock;
SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ;
START TRANSACTION;

-- B1: 锁定 id BETWEEN 20 AND 30（id=20 不存在，id=30 存在，先锁录 id=30，再锁 (20,30)）
SELECT * FROM accounts WHERE id BETWEEN 20 AND 30 FOR UPDATE;
-- 锁定 (20,30) 区间以及 id=30

此时锁状态如下（方括号代表锁定）：

... [10]  [(10,20):A_LOCK]  (20)  [(20,30):B_LOCK]  [30] ...

会话 A 拥有 (10,20) 间隙锁；会话 B 拥有 (20,30) 间隙锁和 id=30 记录锁。

会话 A 继续

-- 会话 A
-- 尝试插入 id=25，属于 (20,30) 区间；但 B 已经锁定 (20,30)，A 阻塞
INSERT INTO accounts (id,balance) VALUES (25, 500);

A 等待 B 释放 (20,30) 间隙锁。

会话 B 继续

-- 会话 B
-- 尝试插入 id=15，属于 (10,20) 区间；但 A 已经锁定 (10,20)，B 阻塞
INSERT INTO accounts (id,balance) VALUES (15, 700);

B 等待 A 释放 (10,20) 间隙锁。

此时 A 等待 B，B 等待 A，就形成了真正的环路死锁：

   A 拥有 (10,20)    B 拥有 (20,30)
     ↑   |               ↑   |
     |   ↓               |   ↓
  等待 (20,30)      等待 (10,20)

InnoDB 检测到这个环路后，会回滚成本较低的事务（假设回滚 A），并抛出死锁错误给会话 A，B 得到锁后自动继续执行。

5. MySQL 中检测与解决死锁

5.1 查看最近一次死锁信息

MySQL 的 InnoDB 会将死锁诊断信息记录在错误日志以及 SHOW ENGINE INNODB STATUS\G 输出的 “LATEST DETECTED DEADLOCK” 段中。

-- 执行后查看死锁信息
SHOW ENGINE INNODB STATUS\G

其中会包含类似如下的内容：

------------------------
LATEST DETECTED DEADLOCK
------------------------
2023-10-10 12:00:00 0x7f8d9c0a4840
*** (1) TRANSACTION:
TRANSACTION 12345, ACTIVE 0 sec inserting
mysql tables in use 1, locked 1
LOCK WAIT 5 lock struct(s), heap size 1136, 1 row lock(s)
MySQL thread id 101, OS thread handle 140392312033024, query id 4567 localhost user update
INSERT INTO accounts (id,balance) VALUES (25,500)
*** (1) HOLDS THE LOCK(S):
RECORD LOCKS space id 123 page no 456 n bits 72 index `PRIMARY` of table `test_deadlock`.`accounts` trx id 12345 lock_mode X locks rec but not gap
*** (1) WALKS INTO LOCKS
RECORD LOCKS space id 123 page no 456 n bits 72 index `PRIMARY` of table `test_deadlock`.`accounts` trx id 12345 lock_mode X locks rec but not gap waiting
Record lock, heap no 2 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
  0: len 4; hex 00000019; asc     ;;
  1: len 4; hex 00000001; asc     ;;
 
*** (2) TRANSACTION:
TRANSACTION 12346, ACTIVE 1 sec selecting
mysql tables in use 1, locked 1
10 lock struct(s), heap size 1136, 5 row lock(s)
MySQL thread id 102, OS thread handle 140392312045136, query id 4568 localhost user update
INSERT INTO accounts (id,balance) VALUES (15,700)
*** (2) HOLDS THE LOCK(S):
RECORD LOCKS space id 123 page no 456 n bits 72 index `PRIMARY` of table `test_deadlock`.`accounts` trx id 12346 lock_mode X locks rec but not gap
Record lock, heap no 1 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
  0: len 4; hex 0000000a; asc     ;;
  1: len 4; hex 00000001; asc     ;;
 
*** (2) WALKS INTO LOCKS
RECORD LOCKS space id 123 page no 456 n bits 72 index `PRIMARY` of table `test_deadlock`.`accounts` trx id 12346 lock_mode X locks rec but not gap waiting
Record lock, heap no 2 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
  0: len 4; hex 00000019; asc     ;;
  1: len 4; hex 00000001; asc     ;;

*** WE ROLL BACK TRANSACTION (1)

上述输出说明事务 12345（会话 A）与 12346（会话 B）之间存在死锁，InnoDB 选择回滚事务 (1)。
其中两者分别持有的锁与等待的锁都被列出，直观显示了死锁原因。

5.2 应用层面捕获死锁并重试

在应用代码中，遇到死锁错误时（错误码 1213, SQLState 40001），通常需捕获异常并重试该事务。例如，伪代码流程：

MAX_RETRY = 3
for i in 1..MAX_RETRY:
    START TRANSACTION
    try:
        执行业务逻辑更新/插入...
        COMMIT
        break  -- 成功退出循环
    except DeadlockError:  -- 捕获 “1213: Deadlock” 错误
        ROLLBACK
        if i == MAX_RETRY:
            raise  -- 超过重试次数，抛出错误
        else:
            # 等待随机短延迟后重试，防止活锁
            sleep(random small milliseconds)
    except OtherError:
        ROLLBACK
        raise  -- 其他错误直接抛出

重试时可加随机延迟（“退避”机制），降低并发冲突概率。
在设计高并发事务逻辑时，应尽量简化事务提交前所持锁的数量与时长，减少死锁概率。

6. 实战演练：多种死锁场景汇总

除了上面两个常见场景，还有以下几种死锁容易出现的场景，建议在开发时多加注意。

6.1 场景一：更新同一张表的两条不同行，顺序不同导致死锁

-- 初始数据
DELETE FROM accounts;
INSERT INTO accounts (id, balance) VALUES (100,1000),(200,2000);

-- 会话 A
START TRANSACTION;
SELECT * FROM accounts WHERE id = 100 FOR UPDATE;
-- (等待 B1 不释放时继续)
UPDATE accounts SET balance = balance - 100 WHERE id = 200;

-- 会话 B
START TRANSACTION;
SELECT * FROM accounts WHERE id = 200 FOR UPDATE;
-- (等待 A1 不释放时继续)
UPDATE accounts SET balance = balance - 200 WHERE id = 100;

-- 此时相互等待，形成死锁

要点：两条事务对同一两条记录加锁顺序不同，导致环路等待。

6.2 场景二：插入唯一索引键值导致死锁

假设表 users 有唯一索引 uname，存在 ('alice') 与 ('bob')：

CREATE TABLE users (
  id INT PRIMARY KEY AUTO_INCREMENT,
  uname VARCHAR(20) UNIQUE,
  active TINYINT(1)
) ENGINE=InnoDB;

INSERT INTO users (uname,active) VALUES ('alice',1),('bob',1);

会话 A 执行：

START TRANSACTION;
SELECT * FROM users WHERE uname BETWEEN 'a' AND 'c' FOR UPDATE;
-- 锁定 (alice,bob) 的临键锁与间隙锁

会话 B 执行：

START TRANSACTION;
SELECT * FROM users WHERE uname BETWEEN 'b' AND 'd' FOR UPDATE;
-- 锁定 (bob) 的临键锁与相应间隙

此时两者都锁住了对方需要插入某个唯一值的间隙，如果接着插入新的 uname 值就可能产生死锁。具体细节类似前面间隙锁演示。

6.3 场景三：插入与更新同时对间隙锁产生冲突

假设表中只有 id=100,200 两条记录，应用中一个事务 A 要更新 id=100 并插入 id=150，另一个事务 B 要更新 id=200 并插入 id=150，在 REPEATABLE READ 下也会死锁。

-- 会话 A
START TRANSACTION;
SELECT * FROM accounts WHERE id = 100 FOR UPDATE;  -- 锁记录100并加 (100,∞) 间隙锁
INSERT INTO accounts (id,balance) VALUES (150,500);  -- 需要锁 (100,200) 区间

-- 会话 B
START TRANSACTION;
SELECT * FROM accounts WHERE id = 200 FOR UPDATE;  -- 锁记录200并加 (100,200),(200,∞) 间隙锁
INSERT INTO accounts (id,balance) VALUES (150,400);  -- 需要锁 (100,200) 区间，等待A

事务 A 已锁住 (100,∞)，要插入 150 时需要 (100,150) 及 (150,200) 区间；
事务 B 已锁住 (100,200) 的一部分间隙；
双方等待对方释放，产生死锁。

7. 预防与解决死锁的实用技巧

统一访问顺序
- 尽量让并发事务对同一张表的多行加锁时，按照相同顺序（如按照主键升序）访问，避免并发事务交叉加锁。
缩短事务时长
- 只在必要的业务逻辑中才开启事务，尽量减少事务内的查询或计算时间，快速提交并释放锁。
使用较低隔离级别
- 如果业务能容忍“幻读”，可将隔离级别设为 READ COMMITTED，此时 InnoDB 不会对范围查询加间隙锁，减少死锁可能性。
```
SET SESSION TRANSACTION ISOLATION LEVEL READ COMMITTED;
```
合理设计索引与 WHERE 条件
- 避免无索引的全表扫描式更新或范围查询，因为此时 InnoDB 会对整张表或大范围加锁，增加死锁风险。
- 对常用查询字段加索引，保证加锁粒度尽量小。
捕获死锁并自动重试
- 在应用层捕获死锁错误（MySQL 错误码 1213），并简单重试。大多数死锁都是“概率性”问题，通过重试便能成功。
- 可为核心业务逻辑设置重试上限，避免持续重试导致响应延迟。
监控死锁频率
- 可查询系统状态变量 SHOW GLOBAL STATUS LIKE 'Innodb_deadlocks'; 查看死锁总次数。
- 将该指标纳入监控告警，一旦死锁频繁发生，说明并发冲突严重，需要优化业务或索引设计。

8. 小结

死锁产生的本质：并发事务因不一致的加锁顺序或重叠的间隙加锁，形成环路等待，InnoDB 检测到后会回滚其中一个事务。
典型诱因：两个或多个事务交叉对相同或相邻记录加锁（记录锁、间隙锁、临键锁），并尝试获取已被对方持有的锁，造成等待环。
解决思路：
1. 统一加锁顺序：保证多个事务以相同顺序访问相同表的行。
2. 减少并发冲突范围：尽量使用精确的索引条件，减少范围锁的使用。
3. 缩短事务时长：让加锁时间尽量短。
4. 使用较低隔离级别：在可接受的业务场景下采用 READ COMMITTED，避开间隙锁。
5. 捕获并重试：应用层捕获死锁错误并自动重试，减轻业务感知影响。

通过本文的代码示例和 ASCII 图解，你应能直观地看到 MySQL InnoDB 中不同锁类型是如何互相等待、形成死锁环的，也清楚地了解如何检测和优化以降低死锁概率。

- 阅读更多 -

MySQL到PostgreSQL迁移实战指南‌

System

2025-06-07

所有,mysql,数据库

以下指南将系统、详尽地介绍如何将 MySQL 数据库平滑迁移到 PostgreSQL，涵盖从环境准备、模式（Schema）转换、数据搬迁、对象（视图、索引、存储过程等）重写，到测试验证等各个环节。文中包含大量代码示例、ASCII 图解和详细说明，帮助你快速上手并理解每个步骤的原理与注意事项。

前言与迁移前思考
MySQL 与 PostgreSQL 差异概述
迁移前的准备工作
1. 环境搭建
2. 评估与规划
  - 评估现有 MySQL 对象
  - 确定目标 PostgreSQL 版本与字符集
  - 制定迁移策略（整库 vs 分库；在线 vs 离线）
使用 pgloader 自动化迁移
手动迁移：DDL 转换与数据搬迁
1. 导出 MySQL 模式
2. 人工转换 DDL 脚本
  - 表结构转换
  - 索引与约束转换
  - 视图与触发器转换
  - 存储过程与函数转换思路
  - 示例：一个简单 DDL 转换案例
3. 创建 PostgreSQL 模式
4. 导出 MySQL 数据为 CSV
5. 导入 CSV 到 PostgreSQL
  - 使用 COPY 命令加速导入
  - 示例：导入单表数据
6. 数据验证与一致性校验
  - 行数对比、Checksum 校验
  - 业务测试示例
序列与自增主键处理
索引、约束与外键映射
视图、触发器、存储过程与函数迁移
迁移后测试与性能调优
生产环境切换注意事项
双写或同步方案
停机窗口与回退策略
监控与报警
总结与常见坑

1. 前言与迁移前思考

在企业级项目中，随着业务不断扩展，可能会面临以下需求或痛点：

数据库扩展性与功能：PostgreSQL 在复杂查询优化、并发控制、ACID 支持等方面更为健壮，且具备更多高级特性（例如：更强大的 JSON、地理空间扩展、窗口函数等）。
成本因素：一些厂商许可或运维成本等原因，希望从 MySQL 迁移到 PostgreSQL。
开源技术选型：逐步统一技术栈，或出于合规、社区活跃度等考虑。

但是 MySQL 与 PostgreSQL 在数据类型、SQL 语法、特性实现上存在差异，直接“搬数据”往往会出现错误或不一致。因此，迁移前需要做好充分的计划与评估。

1.1 迁移前的核心思考

对象清单统计
- 列出所有表、视图、索引、约束、函数、存储过程、触发器、事件调度等。
- 确定是否所有对象都需要迁移，或哪些可重写/抛弃。
数据量与业务停机窗口
- 数据量规模决定迁移方式（在线、离线、增量同步）。
- 业务是否能短暂停机，或需实现 “双写” 与切换时间窗口。
依赖与兼容性
- 应用代码（SQL 语句）是否依赖 MySQL 专有语法；例如 LIMIT offset,count、GROUP_CONCAT、INSERT ... ON DUPLICATE KEY UPDATE 等。
- 需要对 SQL 进行改写或兼容性层（如使用 ORM、数据库抽象层）。
目标特性使用
- PostgreSQL 强调事务一致性与丰富的扩展（例如：PostGIS、pg\_stat\_statements）。
- 在迁移过程中，可考虑利用 PostgreSQL 的新特性（如 JSONB、ARRAY、分区表、CTE、窗口函数等）。
运维与监控
- 目标环境需搭建 PostgreSQL 集群或 HA 架构（如 Patroni、PgPool-II、pgBouncer）。
- 监控指标和告警也需从 MySQL 换成 PostgreSQL 对应工具（如 pg\_stat\_activity、Prometheus Exporter 等）。

有了清晰的思考与规划，才能在后续步骤中有的放矢，避免中途反复。

2. MySQL 与 PostgreSQL 差异概述

在进行迁移前，需要对二者的区别有全面认识，才能针对性地进行转换与调整。下面从数据类型、语法、函数等多个维度进行对比。

2.1 数据类型差异

功能/类型	MySQL	PostgreSQL	备注
整数类型	TINYINT, SMALLINT, MEDIUMINT, INT, BIGINT	SMALLINT, INTEGER, BIGINT	PostgreSQL 没有 MEDIUMINT；TINYINT 在 Pg 中可等价为 SMALLINT
浮点/定点类型	FLOAT, DOUBLE, DECIMAL(M,D)	REAL, DOUBLE PRECISION, NUMERIC(precision, scale)	刻度与精度语法稍有不同
字符串类型	CHAR(n), VARCHAR(n), TEXT, BLOB	CHAR(n), VARCHAR(n), TEXT, BYTEA	BLOB -> BYTEA
日期/时间类型	DATE, DATETIME, TIMESTAMP, TIME, YEAR	DATE, TIMESTAMP [WITHOUT TIME ZONE], TIME, INTERVAL	PostgreSQL 的 TIMESTAMP 默认无时区，可指定 WITH TIME ZONE
枚举与集合	ENUM('a','b'), SET('x','y')	无原生 ENUM/SET，需自建 CHECK 约束或使用 DOMAIN	PostgreSQL 自 9.1 支持 CREATE TYPE ... AS ENUM
布尔类型	TINYINT(1) / BOOLEAN	BOOLEAN	MySQL 的 BOOLEAN 实际是 TINYINT(1)
二进制字符串	BINARY(n), VARBINARY(n), BLOB	BYTEA
JSON	JSON	JSONB / JSON	PostgreSQL 推荐使用 JSONB，具备索引支持
UUID	无原生支持，用 CHAR(36) 存储	UUID	PostgreSQL 内置 UUID 类型

示例对比

MySQL：

CREATE TABLE user_info (
    id INT AUTO_INCREMENT PRIMARY KEY,
    username VARCHAR(50) NOT NULL,
    bio TEXT,
    profile_pic BLOB,
    is_active TINYINT(1) DEFAULT 1,
    created_at DATETIME DEFAULT CURRENT_TIMESTAMP,
    balance DECIMAL(10,2),
    preferences JSON
);

PostgreSQL：

CREATE TABLE user_info (
    id SERIAL PRIMARY KEY,
    username VARCHAR(50) NOT NULL,
    bio TEXT,
    profile_pic BYTEA,
    is_active BOOLEAN DEFAULT TRUE,
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    balance NUMERIC(10,2),
    preferences JSONB
);

2.2 自增主键 vs 序列

MySQL

CREATE TABLE t1 (
    id INT AUTO_INCREMENT PRIMARY KEY,
    name VARCHAR(50)
);

插入时可忽略 id，自动递增。

PostgreSQL
早期常用：

CREATE TABLE t1 (
    id SERIAL PRIMARY KEY,
    name VARCHAR(50)
);

SERIAL 本质会创建一个关联的序列：

CREATE SEQUENCE t1_id_seq START 1;
CREATE TABLE t1 (
    id INT NOT NULL DEFAULT nextval('t1_id_seq'),
    name VARCHAR(50),
    PRIMARY KEY (id)
);
ALTER SEQUENCE t1_id_seq OWNED BY t1.id;

PostgreSQL 10+ 支持更标准的 IDENTITY：

CREATE TABLE t1 (
    id INT GENERATED BY DEFAULT AS IDENTITY PRIMARY KEY,
    name VARCHAR(50)
);

2.3 SQL 语法差异

字符串引号
- MySQL：'single quotes'；双引号可用作标识符引号（若开启 ANSI\_QUOTES）。
- PostgreSQL：'single quotes'；双引号仅用于标识符（区分大小写）。
LIMIT 与 OFFSET
- MySQL：SELECT * FROM t1 LIMIT 10,20; 或 LIMIT 20 OFFSET 10。
- PostgreSQL：仅 SELECT * FROM t1 LIMIT 20 OFFSET 10;。

INSERT … ON DUPLICATE KEY UPDATE

MySQL：

INSERT INTO t1 (id,name) VALUES (1,'A') 
ON DUPLICATE KEY UPDATE name=VALUES(name);

PostgreSQL：等价实现用 INSERT … ON CONFLICT：

INSERT INTO t1 (id,name) VALUES (1,'A')
ON CONFLICT (id) DO UPDATE SET name = EXCLUDED.name;

LIMIT 子句位置
- MySQL：SELECT ... FOR UPDATE LIMIT 1;
- PostgreSQL：不支持 LIMIT 在 FOR UPDATE 之后；应写作：
```
SELECT ... LIMIT 1 FOR UPDATE;
```
字符串函数差异
- MySQL：CONCAT_WS(',', col1, col2)、IFNULL(a,b)、NOW()、UNIX_TIMESTAMP() 等。
- PostgreSQL：
  - CONCAT_WS() 同名但行为略有区别。
  - 等价 COALESCE(a,b) 代替 IFNULL。
  - NOW() 同样存在；EXTRACT(EPOCH FROM NOW()) 代替 UNIX_TIMESTAMP()。
  - GROUP_CONCAT() 在 PostgreSQL 中可用 string_agg(col, ',')。
事务隔离与锁
- MySQL 默认隔离级别为 REPEATABLE READ；PostgreSQL 默认为 READ COMMITTED。
- MySQL 锁模型中 UPDATE ... LOCK IN SHARE MODE；PostgreSQL 是 FOR SHARE / FOR UPDATE。

2.4 函数与存储过程差异

MySQL 用 Stored Procedure / Function，语法如：

DELIMITER //
CREATE PROCEDURE add_user(IN uname VARCHAR(50))
BEGIN
    INSERT INTO users(name) VALUES (uname);
END;
//
DELIMITER ;

PostgreSQL 使用 PL/pgSQL 语法：

CREATE OR REPLACE FUNCTION add_user(uname VARCHAR)
RETURNS VOID AS $$
BEGIN
    INSERT INTO users(name) VALUES (uname);
END;
$$ LANGUAGE plpgsql;

主要差别在于：

MySQL 用 DELIMITER 将语句包裹，而 PostgreSQL 用 $$ 标识函数体。
变量声明、流程控制（IF/LOOP）语法也略有不同，需要重写。

2.5 大小写与标识符引号

MySQL
- 表名/列名按文件系统而定（Linux 默认区分大小写，Windows 不区分）。
- 引用标识符用反引号：\`table\_name\`。
PostgreSQL
- 默认自动将未加双引号的标识符转换为小写；双引号内的标识符才会保留大小写。
- 建议尽量统一使用全小写表名/列名，避免双引号带来的混乱。

3. 迁移前的准备工作

3.1 环境搭建

MySQL 环境：确认 MySQL 版本（例如 5.7、8.0），并检查是否有自定义插件或功能在迁移中需要特别支持。
PostgreSQL 环境：准备好目标数据库服务器，建议使用类似版本（例如 PostgreSQL 13、14），并设置好管理员账号及密码。
网络与访问：确保 MySQL 与 PostgreSQL 服务器之间网络互通，可通过客户端访问并具备足够权限。
工具安装：建议本机或迁移服务器上安装以下工具：
- mysqldump（MySQL 自带）
- psql（PostgreSQL 客户端）
- pgloader（PostgreSQL 迁移神器）
- pg_dump（用于备份测试目标库）
- csvkit、jq 等用于数据处理的辅助工具（可选）

3.2 评估与规划

导出对象清单
在 MySQL 上运行以下命令，将库中所有表/视图/存储过程等导出清单：

mysql -uroot -p -e "SHOW TABLES IN mydb;" > tables.txt
mysql -uroot -p -e "SHOW FULL TABLES IN mydb WHERE Table_type = 'VIEW';" > views.txt
mysql -uroot -p -e "SHOW PROCEDURE STATUS WHERE Db = 'mydb';" > procs.txt
mysql -uroot -p -e "SHOW TRIGGERS IN mydb;" > triggers.txt

将输出结果保存在本地，用于后续分析哪些对象需人工转换。

确定迁移策略
- 整库迁移：如果是一次性较短停机，直接将整个库导出并导入。
- 分表/分库迁移：如果要渐进式或增量迁移，可先将部分表导入 PostgreSQL，待业务允许再切换。
- 在线迁移：可以借助 pgloader 的增量功能或使用逻辑订阅工具（如 debezium、Bottled Water）实现 Near Zero Downtime。
制定回退方案
- 在完成迁移后，若发现业务异常，需要快速回滚到 MySQL；因此要保留 MySQL 库备份，或者保持双写。
- 记录 PostgreSQL 迁移后数据校验情况＆应用改写情况，确保回退可行。

4. 使用 pgloader 自动化迁移

pgloader 是一款开源工具，可一站式实现从 MySQL（甚至 SQLite、MS SQL 等）迁移到 PostgreSQL，自动转换数据类型、DDL、索引、外键等。推荐在大部分场景下优先尝试 pgloader。

4.1 pgloader 简介

特点
1. 自动转换 MySQL DDL 为 PostgreSQL DDL，处理常见数据类型差异（如 TINYINT -> SMALLINT、DATETIME -> TIMESTAMP 等）。
2. 自动导出 MySQL 数据并批量 COPY 导入 PostgreSQL，速度远超 mysqldump + 手动导入。
3. 支持增量迁移与断点续传。
4. 可用纯文本 DSL 配置文件编写迁移规则，也可直接命令行运行。
工作流程
1. 连接 MySQL，读取源库的模式信息与数据。
2. 在 PostgreSQL 中创建目标库、模式与表结构。
3. 分批次将源数据导出到临时表或内存，然后使用 PostgreSQL 的 COPY 命令导入。
4. 创建索引、外键、触发器（部分对象需手动后处理）。

+-----------+            pgloader           +----------------+
|  MySQL    |  -------------------------->  | PostgreSQL     |
| 源数据库  |    1. 读取 DDL、数据          | 目标数据库      |
|           |                              |                 |
+-----------+            2. 转换 & 导入     +----------------+

4.2 安装 pgloader

在多数系统中，可通过包管理器安装，也可从源代码编译。以下以 Ubuntu 为例：

# 安装依赖
sudo apt-get update
sudo apt-get install -y curl git build-essential

# 推荐使用二进制包安装（Ubuntu 20.04+）
sudo apt-get install -y pgloader

或者从源码安装最新版本：

# 安装 SBCL（Steel Bank Common Lisp）和依赖
sudo apt-get install -y sbcl libsqlite3-dev libmysqlclient-dev libssl-dev make

git clone https://github.com/dimitri/pgloader.git
cd pgloader
make pgloader
sudo make install

安装完成后，可执行：

pgloader --version
# 示例输出：pgloader version “3.6.2”

4.3 pgloader 配置文件示例

创建一个名为 mysql2pg.load 的配置文件，内容示例如下（适用于将 MySQL 数据库 mydb 迁移到 PostgreSQL 数据库 pgdb）：

LOAD DATABASE
     FROM mysql://mysqluser:mysqlpass@mysql-host:3306/mydb
     INTO postgresql://pguser:pgpass@pg-host:5432/pgdb

WITH include drop,         -- 迁移前 DROP 目标表
     create tables,        -- 自动创建表
     create indexes,       -- 自动创建索引
     reset sequences,      -- 根据导入数据重置序列
     data only if exists,  -- 跳过空表
     batch rows = 10000,   -- 每批条数
     concurrency = 4,      -- 并发线程数
     prefetch rows = 1000

CAST
     type datetime to timestamptz drop default drop not null using zero-dates-to-null,
     type date to date drop not null using zero-dates-to-null,
     type tinyint when (= precision 1) to boolean using tinyint-to-boolean,
     type tinyint to smallint,
     type mediumint to integer,
     type int to integer,
     type bigint to bigint,
     type double to double precision,
     type enum to text drop not null,
     type set to text drop not null

 BEFORE LOAD DO
   $$ create schema if not exists public; $$,

AFTER LOAD DO
   $$ ALTER SCHEMA 'public' OWNER TO 'pguser'; $$;

配置项解释

LOAD DATABASE FROM mysql://… INTO postgresql://…：指定源 MySQL 与目标 PostgreSQL 连接字符串。
WITH include drop：在创建表前如果目标已存在同名表会先执行 DROP TABLE，避免冲突。
create tables, create indexes：自动在 PG 中创建 MySQL 对应的表与索引。
reset sequences：导入后重置自增序列，使其值等于最大主键值。
batch rows、concurrency：控制导入批量大小与并发度，越大越快，但受限于网络与资源。
CAST：数据类型映射规则，例如 datetime 映射到 timestamptz 并去除默认值、非空约束，tinyint(1) 映射为 boolean 等。
BEFORE LOAD DO / AFTER LOAD DO：在迁移前/后要执行的 SQL 语句，用于创建模式、调整权限等。

Tip：若你的 MySQL 中有大量 zero dates（0000-00-00），需要将其映射为 NULL，否则 PG 导入会报错，可使用 using zero-dates-to-null 这样的转换函数。

将上述保存为 mysql2pg.load 后，执行：

pgloader mysql2pg.load

pgloader 会自动读取并执行迁移过程，整个流程可能会打印大量日志，例如：

2023-10-10T10:00:00.123000Z LOG Migrating from #<MYSQL-CONNECTION mysqluser@mysql-host:3306/mydb {10070E70C3}>
2023-10-10T10:00:00.130000Z LOG Migrating into #<PGSQL-CONNECTION pguser@pg-host:5432/pgdb {10070F8913}>
...
2023-10-10T10:02:34.456000Z LOG Create table 'public'.'users'
2023-10-10T10:02:34.789000Z LOG Copying "mydb"."users" with batch size 10000
2023-10-10T10:02:50.123000Z LOG Reset sequence 'users_id_seq'
...
2023-10-10T10:05:12.345000Z LOG Migration finished.

4.4 一键执行迁移

如果不需要特别的 CAST 规则，也可直接在命令行运行，无需单独配置文件：

pgloader mysql://mysqluser:mysqlpass@mysql-host:3306/mydb \
         postgresql://pguser:pgpass@pg-host:5432/pgdb

pgloader 会使用默认规则进行迁移，但对某些数据类型或编码可能不够准确，建议还是写配置文件。

4.5 pgloader 运行日志解析

“Create table”：表示为每个 MySQL 表在 PG 中生成对应 DDL。
“Copying”：开始批量将数据导入 PG，后面会打印每批的行数与耗时。
“Reset sequence”：表示已根据目标表的最大主键值，重置序列到合适的起始值。
“Create index”/“Create FOREIGN KEY”：分别为索引与外键创建。

如果日志中有 “Error”、“Warn” 字样，需要仔细定位并人工处理。例如：

2023-10-10T10:03:22.567000Z ERROR PostgreSQL warning: ERROR:  invalid byte sequence for encoding "UTF8": 0x80

此类报错说明字符编码不一致，需要在 CAST 中做额外处理或先清洗数据。

4.6 pgloader 常见问题与调优

字符编码问题
- 如果 MySQL 源库为 latin1、utf8mb4 等，需要在连接字符串中显式指定编码，例如：
```
mysql://user:pass@host:3306/mydb?charset=utf8mb4
```
- pgloader 默认会将数据以 UTF8 编码传给 PG，若出现无效编码错误，可先在 MySQL 层用 CONVERT() 函数清洗或加 USING 规则。
大对象导入过慢
- 若表中有大量 BLOB 或 TEXT，可通过 batch rows 参数减少单批大小或调低并发度。
外键约束导入失败
- 如果外键关联表尚未创建或创建顺序错误，可在 pgloader 脚本中先禁用外键创建（with no foreign keys），待数据导入完成后，再手动在 PG 中创建外键。
触发器与视图不支持自动迁移
- pgloader 不会自动迁移 MySQL 视图与触发器，需要在迁移后手动转换并在 PG 中重建。
日志容量与磁盘 IO
- 大规模迁移时会产生大量日志与事务，确保 PG 服务器有充足磁盘空间，并根据需要调整 PG 的 maintenance_work_mem、checkpoint_segments 等参数。

5. 手动迁移：DDL 转换与数据搬迁

在某些场景下，无法使用 pgloader 或需要对迁移过程进行精细控制，就必须手动完成模式转换与数据搬迁。下面示例演示整个过程的核心步骤。

5.1 导出 MySQL 模式

使用 mysqldump 导出不带数据的模式定义（--no-data）：

mysqldump -uroot -p --no-data --routines --triggers mydb > mydb_schema.sql

该文件会包含：

CREATE TABLE 语句
CREATE INDEX
CREATE VIEW
DELIMITER 包裹的存储过程与触发器定义

5.2 人工转换 DDL 脚本

打开 mydb_schema.sql，逐个 CREATE 语句进行调整。以下以示例表 users 为例说明常见转换要点。

5.2.1 示例：MySQL 原始 DDL

-- MySQL 版本
CREATE TABLE `users` (
  `id` INT NOT NULL AUTO_INCREMENT,
  `username` VARCHAR(50) NOT NULL,
  `email` VARCHAR(100) DEFAULT NULL,
  `created_at` DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP,
  `is_active` TINYINT(1) NOT NULL DEFAULT '1',
  PRIMARY KEY (`id`),
  UNIQUE KEY `uniq_email` (`email`),
  KEY `idx_username` (`username`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;

5.2.2 转换为 PostgreSQL DDL

-- PostgreSQL 版本
CREATE TABLE users (
    id SERIAL PRIMARY KEY,
    username VARCHAR(50) NOT NULL,
    email VARCHAR(100),
    created_at TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP,
    is_active BOOLEAN NOT NULL DEFAULT TRUE
);

-- 唯一约束
CREATE UNIQUE INDEX uniq_email ON users(email);

-- 普通索引
CREATE INDEX idx_username ON users(username);

去除反引号，改用小写无引号表名/列名（或用双引号保留大小写）。
INT AUTO_INCREMENT → SERIAL（自动创建序列与默认值）。
TINYINT(1) → BOOLEAN；且默认值 1 → TRUE。
DATETIME → TIMESTAMP，CHARSET=utf8mb4 可以忽略，PG 默认 UTF8 即可。
将 MySQL 的 UNIQUE KEY 与 KEY 分别转换为 PostgreSQL 的 CREATE UNIQUE INDEX 与 CREATE INDEX。

注意：若原表使用了复合索引或全文索引，需检查 PostgreSQL 支持情况并做相应改写；例如：全文索引需要用 GIN 或 GiST 索引 + tsvector。

5.2.3 视图转换示例

MySQL 视图：

CREATE VIEW user_emails AS
SELECT id, CONCAT(username, '@example.com') AS full_email
FROM users
WHERE is_active = 1;

PostgreSQL 视图：

CREATE VIEW user_emails AS
SELECT id, username || '@example.com' AS full_email
FROM users
WHERE is_active = TRUE;

CONCAT() → || 字符串拼接。
is_active = 1 → is_active = TRUE。

5.2.4 触发器转换示例

MySQL 触发器：

DELIMITER //
CREATE TRIGGER before_user_insert
BEFORE INSERT ON users
FOR EACH ROW
BEGIN
  IF NEW.email IS NULL THEN
    SET NEW.email = CONCAT(NEW.username, '@example.com');
  END IF;
END;
//
DELIMITER ;

PostgreSQL 触发器需要先写触发函数，再关联触发器：

-- 创建触发函数
CREATE OR REPLACE FUNCTION before_user_insert_fn()
RETURNS TRIGGER AS $$
BEGIN
  IF NEW.email IS NULL THEN
    NEW.email := NEW.username || '@example.com';
  END IF;
  RETURN NEW;
END;
$$ LANGUAGE plpgsql;

-- 关联触发器
CREATE TRIGGER before_user_insert
BEFORE INSERT ON users
FOR EACH ROW
EXECUTE FUNCTION before_user_insert_fn();

MySQL SET NEW.email → PG NEW.email :=。
DELIMITER 概念在 PG 不适用，用 $$ 或其他界定符标识函数体。

5.3 创建 PostgreSQL 模式

将转换后的 DDL 保存为 pg_schema.sql，然后在目标 PostgreSQL 上执行：

psql -U pguser -d pgdb -f pg_schema.sql

验证模式是否正确创建：

\dt   -- 列出表
\di   -- 列出索引
\dv   -- 列出视图
\df   -- 列出函数

5.4 导出 MySQL 数据为 CSV

对于每个表，使用 SELECT ... INTO OUTFILE 导出数据为 CSV。例如，将 users 表导出：

-- 在 MySQL 上执行（需确保 MySQL 服务器对 /tmp 目录可写，且客户端有 FILE 权限）
SELECT id, username, email, created_at, is_active
INTO OUTFILE '/tmp/users.csv'
FIELDS TERMINATED BY ','
ENCLOSED BY '"'
LINES TERMINATED BY '\n'
FROM users;

执行后，会在 MySQL 服务器的 /tmp/users.csv 生成文件。然后通过 scp 或其他方式将文件拉到 PostgreSQL 服务器。

注意：如果 MySQL 服务器不在迁移服务器本机，可通过 mysqldump --tab 或 SELECT ... INTO DUMPFILE 等方式先导出；也可使用客户端 mysql --batch 结合重定向生成 CSV。

5.5 导入 CSV 到 PostgreSQL

在 PostgreSQL 服务器上，将 users.csv 放入某个目录（如 /var/lib/postgresql/data/），然后执行：

-- 登录 PostgreSQL
psql -U pguser -d pgdb

-- 使用 COPY 导入数据
COPY users(id, username, email, created_at, is_active)
FROM '/path/to/users.csv'
DELIMITER ','
CSV HEADER;

示例：如果 CSV 第一行并不包含列名，可去掉 HEADER，或手动加上列头。

如果 is_active 导出的是 0/1，PG 会自动映射为 TRUE/FALSE。
对于日期/时间字段，若有格式兼容问题，可使用 TO_TIMESTAMP() 辅助转换，或在导入前清洗 CSV。

5.6 数据验证与一致性校验

导入完成后，可通过以下方式检验数据一致性：

行数对比

-- MySQL 原库（在 MySQL 上执行）
SELECT COUNT(*) FROM users;

-- PostgreSQL 目标库（在 pg 上执行）
SELECT COUNT(*) FROM users;

两者结果应相同。

校验和（Checksum）
对关键列计算校验和：

-- MySQL
SELECT MD5(GROUP_CONCAT(id,username,email SEPARATOR '|')) AS checksum FROM users;

-- PostgreSQL
SELECT MD5(string_agg(id || username || email, '|')) AS checksum FROM users;

需保证两侧字符串拼接方式一致，再比对 MD5 值。

随机抽样比对

-- MySQL
SELECT * FROM users ORDER BY RAND() LIMIT 10;

-- PostgreSQL
SELECT * FROM users ORDER BY RANDOM() LIMIT 10;

检查若干随机行数据是否一致。

业务测试
- 运行应用代码或测试脚本，针对核心业务场景做功能性验证。
- 检查外键约束、触发器逻辑是否生效。

只有在上述验证通过后，才能进入正式切换和上线阶段。

6. 序列与自增主键处理

MySQL 中的自增主键需要在 PostgreSQL 中映射为序列，以保证插入逻辑一致。

6.1 MySQL AUTO\_INCREMENT 转 PostgreSQL SERIAL/IDENTITY

在 MySQL DDL 中：

CREATE TABLE products (
    id INT NOT NULL AUTO_INCREMENT,
    name VARCHAR(100),
    price DECIMAL(10,2),
    PRIMARY KEY (id)
);

转换为 PostgreSQL：

-- 方法一：使用 SERIAL
CREATE TABLE products (
    id SERIAL PRIMARY KEY,
    name VARCHAR(100),
    price NUMERIC(10,2)
);

-- 方法二：使用 IDENTITY（PostgreSQL 10+）
CREATE TABLE products (
    id INT GENERATED BY DEFAULT AS IDENTITY PRIMARY KEY,
    name VARCHAR(100),
    price NUMERIC(10,2)
);

6.2 手动创建序列示例

如果不使用 SERIAL，也可手动创建序列并指定默认值：

CREATE SEQUENCE products_id_seq
    START WITH 1
    INCREMENT BY 1
    NO MINVALUE
    NO MAXVALUE
    CACHE 1;

CREATE TABLE products (
    id INT NOT NULL DEFAULT nextval('products_id_seq'),
    name VARCHAR(100),
    price NUMERIC(10,2),
    PRIMARY KEY (id)
);

ALTER SEQUENCE products_id_seq OWNED BY products.id;

6.3 同步序列当前值

当数据已导入后，需要让序列的起始值大于等于当前表中最大 id，否则后续插入会因主键冲突报错。例如，数据导入后：

SELECT MAX(id) FROM products;  -- 假设返回 125

则执行：

SELECT setval('products_id_seq', 125);

这样序列下一个值即为 126，保证插入不会重复。

7. 索引、约束与外键映射

7.1 索引类型对比与语法转换

普通索引
- MySQL：KEY idx_name (col1, col2)
- PostgreSQL：CREATE INDEX idx_name ON table(col1, col2);
唯一索引 / 唯一约束
- MySQL：UNIQUE KEY uniq_name (col)
- PostgreSQL：CREATE UNIQUE INDEX uniq_name ON table(col);
  或者在建表时：UNIQUE(col)。

全文索引 / 全文搜索

MySQL：FULLTEXT KEY ft_idx (col)

PostgreSQL：需要使用 GIN 索引与 tsvector，示例：

ALTER TABLE articles ADD COLUMN content_tsv tsvector;
UPDATE articles SET content_tsv = to_tsvector('english', content);
CREATE INDEX ft_idx ON articles USING GIN (content_tsv);

同时可加触发器保持 tsvector 列自动更新。

7.2 唯一约束与主键

MySQL：

CREATE TABLE t1 (
  id INT AUTO_INCREMENT,
  email VARCHAR(100),
  PRIMARY KEY(id),
  UNIQUE KEY uniq_email (email)
);

PostgreSQL：

CREATE TABLE t1 (
  id SERIAL PRIMARY KEY,
  email VARCHAR(100) UNIQUE
);

7.3 外键约束语法差异

MySQL：

CREATE TABLE orders (
  id INT AUTO_INCREMENT PRIMARY KEY,
  user_id INT,
  FOREIGN KEY (user_id) REFERENCES users(id)
    ON DELETE CASCADE
    ON UPDATE NO ACTION
);

PostgreSQL：

CREATE TABLE orders (
  id SERIAL PRIMARY KEY,
  user_id INT,
  CONSTRAINT fk_orders_user
    FOREIGN KEY (user_id)
    REFERENCES users(id)
    ON DELETE CASCADE
    ON UPDATE NO ACTION
);

两者在外键约束上差异不大，只是语法略有格式不同；要注意在创建顺序上，必须先建被引用表（users），再建引用表（orders）。

8. 视图、触发器、存储过程与函数迁移

除了表与数据，业务中常会使用视图（VIEW）、触发器（TRIGGER）、存储过程（PROCEDURE）与函数（FUNCTION）。由于二者平台差异，需要手动重写。

8.1 视图转换示例

MySQL 视图：

CREATE VIEW active_users AS
SELECT id, username, email
FROM users
WHERE is_active = 1;

PostgreSQL 视图：

CREATE OR REPLACE VIEW active_users AS
SELECT id, username, email
FROM users
WHERE is_active = TRUE;

is_active = 1 → is_active = TRUE；
建议在 PostgreSQL 中显式使用 OR REPLACE，方便后续更新视图。

8.2 触发器转换示例

MySQL 触发器（before insert 示例）：

CREATE TRIGGER trg_before_insert_orders
BEFORE INSERT ON orders
FOR EACH ROW
BEGIN
  IF NEW.created_at IS NULL THEN
    SET NEW.created_at = NOW();
  END IF;
END;

PostgreSQL 触发器：

-- 先创建触发函数
CREATE OR REPLACE FUNCTION trg_before_insert_orders_fn()
RETURNS TRIGGER AS $$
BEGIN
  IF NEW.created_at IS NULL THEN
    NEW.created_at := NOW();
  END IF;
  RETURN NEW;
END;
$$ LANGUAGE plpgsql;

-- 再创建触发器
CREATE TRIGGER trg_before_insert_orders
BEFORE INSERT ON orders
FOR EACH ROW
EXECUTE FUNCTION trg_before_insert_orders_fn();

MySQL 将触发函数与触发器写在同一段；PG 需要先创建函数，再用 EXECUTE FUNCTION 关联。

8.3 存储过程与函数重写思路

MySQL 存储过程：

DELIMITER //
CREATE PROCEDURE add_order(IN uid INT, IN amt DECIMAL(10,2))
BEGIN
  INSERT INTO orders(user_id, amount, created_at)
  VALUES(uid, amt, NOW());
  SELECT LAST_INSERT_ID() AS order_id;
END;
//
DELIMITER ;

PostgreSQL 函数：

CREATE OR REPLACE FUNCTION add_order(uid INT, amt NUMERIC)
RETURNS INT AS $$
DECLARE
  new_id INT;
BEGIN
  INSERT INTO orders(user_id, amount, created_at)
    VALUES(uid, amt, NOW())
    RETURNING id INTO new_id;
  RETURN new_id;
END;
$$ LANGUAGE plpgsql;

MySQL LAST_INSERT_ID() → PostgreSQL RETURNING id INTO new_id。
PL/pgSQL 语法中，参数在函数名后定义，返回类型放在 RETURNS 后。
MySQL 的控制流（IF/LOOP）需按照 PL/pgSQL 格式书写。

9. 迁移后测试与性能调优

9.1 功能测试与回归

基本 CRUD 测试

在 PostgreSQL 上执行典型的增删改查，验证业务逻辑一致性。

示例：

SELECT * FROM users WHERE email LIKE '%@test.com';
INSERT INTO orders(user_id, amount) VALUES(1, 100.50);
UPDATE users SET is_active = FALSE WHERE id = 2;
DELETE FROM sessions WHERE user_id = 3;

事务测试

验证事务隔离与一致性（PostgreSQL 默认为 READ COMMITTED，可设置为 REPEATABLE READ/SERIALIZABLE）。

示例：

BEGIN;
  SELECT balance FROM accounts WHERE id = 1 FOR UPDATE;
  UPDATE accounts SET balance = balance - 50 WHERE id = 1;
  UPDATE accounts SET balance = balance + 50 WHERE id = 2;
COMMIT;

并发压力测试
- 使用工具（如 pgbench、sysbench）进行并发测试，模拟真实场景负载，比较 MySQL 与 PostgreSQL 性能差异。
- 示例 pgbench：
```
pgbench -i -s 10 pgdb     # 初始化表与数据
pgbench -c 20 -j 4 -T 60 pgdb   # 并发 20 客户端，4 个进程，持续 60 秒
```

9.2 性能基准对比

索引优化
- PostgreSQL 建议为常用查询字段创建合适的 B-tree、GIN、GiST 索引。
- 使用 EXPLAIN ANALYZE 分析慢查询，调整索引与查询方式。

配置调优

根据服务器内存调整以下参数（编辑 postgresql.conf）：

shared_buffers = 25%        # 一般为可用内存的 1/4
work_mem = 16MB             # 根据并发查询复杂度设置
maintenance_work_mem = 128MB # 用于创建索引、VACUUM
effective_cache_size = 50%  # 预估操作系统缓存可用空间
checkpoint_completion_target = 0.7
wal_buffers = 16MB
max_wal_size = 1GB

启用 pg_stat_statements 扩展，记录 SQL 执行统计，帮助定位瓶颈：
```
CREATE EXTENSION pg_stat_statements;
```

VACUUM 与 ANALYZE
- 在导入大批量数据后，需执行 VACUUM ANALYZE 优化表与更新统计信息：
```
VACUUM (VERBOSE, ANALYZE) mytable;
```
- 定期运行 VACUUM，避免表膨胀。

9.3 索引与查询优化

使用正确的连接顺序
- PostgreSQL 查询优化器会自动选择，但对复杂多表 JOIN、子查询，可通过 EXPLAIN 查看执行计划。
- 根据执行计划，可添加组合索引、或对查询重写（如用 CTE、窗口函数代替子查询）。
避免过度索引
- 虽然索引能加速查询，但插入/更新时会增加维护开销。根据业务场景平衡索引数量。
分页查询与 LIMIT 优化
- 大数据量分页时，避免 OFFSET 较大带来的性能下降，建议用 WHERE id > last_id LIMIT n 方式实现“基于主键”的分页。

10. 生产环境切换注意事项

10.1 双写或同步方案

数据双写
- 在应用层实现：在业务代码中同时向 MySQL 与 PostgreSQL 写入（先写 MySQL，后写 PG；需处理写失败的异常回滚）。
- 适用于业务容忍短时间延迟，切换时需保证数据一致。
使用中间件
- 利用 Debezium + Kafka + Sink Connector 将 MySQL 二进制日志实时推送到 PostgreSQL，近似实时同步。
- 或者使用商业化数据同步工具（如 SymmetricDS、DataX、GoldenGate）实现双向同步或单向同步。
切换时强制停止写入
- 在切换窗口，将业务写入全指向 MySQL，导数据后验证，暂停写入直到应用切换完成。
- 缺点是业务会有停写窗口。

10.2 停机窗口与回退策略

停机步骤示例
1. 将应用的写入切换到 Maintenance 模式或读写分离（只写入 MySQL）。
2. 运行最后一次增量同步脚本，确保 PostgreSQL 数据与 MySQL 完全一致。
3. 将应用数据库连接配置切换到 PostgreSQL，执行 Smoke Test。
4. 如果一切正常，解除 Maintenance；否则，回退到 MySQL 连接，重新评估。
回退策略
- 保留最近快照：保留最后一次同步后 MySQL 的快照，或保留数据双写日志，以便快速回滚。
- 读写分离：将 PostgreSQL 设置为只读，观察一定时间后再完全切换。
- 日志回放：若回退，需要保证在迁移后仍能回放 MySQL-binlog（可利用 mysqlbinlog 将变更导回 MySQL）。

10.3 监控与报警

数据库可用性监控
- 建立对 PostgreSQL 的连接数、事务延迟、死锁、锁等待等指标监控。
- 使用工具如 pgwatch2、Zabbix、Prometheus + Grafana。
应用层监控
- 监测业务错误率，尤其是切换后是否出现连接错误、查询异常等。
- 当故障阈值超过预设上限时，自动触发告警并启用回退机制。

11. 总结与常见坑

11.1 迁移常见坑汇总

字符编码不一致
- MySQL 使用 latin1 或 utf8mb4，PG 默认 UTF8。导入时必须确保编码转换正确，否则会出现乱码或报错。
DATETIME 与 TIMESTAMP 差异
- MySQL TIMESTAMP 会自动以时区存储 & 转换，PG TIMESTAMP 默认不带时区，或用 TIMESTAMP WITH TIME ZONE。
- 注意数据中是否存在历史时区影响的时间戳，需要转换。
MySQL 零日期
- MySQL 中可能存在 0000-00-00 或 0000-00-00 00:00:00。PG 不支持此类“零”日期，需转换为 NULL 或合法日期。
ENUM 与 SET
- MySQL ENUM('a','b') → PG 可用 CREATE TYPE ... AS ENUM('a','b')，或直接映射为 TEXT + CHECK。
- 如果使用 SET，则需转换为数组类型或字符串并自行拆分。
存储过程与函数
- 需要手动重写，且 PL/pgSQL 语法与 MySQL 存储语言存在差异，常见 IF、LOOP、CURSOR、HANDLER 等都要重写。
全文搜索
- MySQL FULLTEXT 索引与 MATCH ... AGAINST 语法，PG 需使用 tsvector + GIN 并用 to_tsvector()／to_tsquery()。
分页与 LIMIT 语义
- MySQL LIMIT offset,count；PG 只能 LIMIT count OFFSET offset。
- 大量大偏移分页性能差，建议用主键范围分页。
时区与时钟差异
- PG 默认时区可通过 SHOW TIMEZONE; 查看，需要与应用一致。
- 如果 MySQL 中使用了 NOW() 或 UTC_TIMESTAMP()，要检查 PG 中等价的 CURRENT_TIMESTAMP 是否一致。

11.2 迁移建议与最佳实践

先在测试环境做一次全流程演练
- 不断优化脚本与配置，积累经验，减少生产环境中的未知情况。
通过 pgloader 自动迁移优先
- 若无法满足业务中所有自定义需求，再采取手动迁移。pgloader 能极大降低工作量与出错率。
分阶段迁移
- 对于大型数据库，可先迁移非关键表，逐步完善脚本与流程，最后统一切换。
编写迁移 & 验证脚本
- 将所有导出、转换、导入、验证操作编写成脚本（Bash、Python、Makefile 等），确保可重复执行与回滚。
加强监控
- 迁移完成后，需要持续关注 PostgreSQL 的性能指标（如 slow queries、锁等待、死锁等），并根据情况优化索引与参数。
培训与文档
- 由于 PostgreSQL 与 MySQL 在使用习惯与语法细节上存在差别，需要对开发团队与运维团队进行培训，并留存详细的迁移文档。

ASCII 图解：MySQL → PostgreSQL 整体迁移流程

+----------------------+        +----------------------+       +----------------------+
|     MySQL 源库        |  1. 导出 DDL/DATA        |  2. 转换脚本   | PostgreSQL 测试环境    |
|  （mydb. users, orders）|----------------------->|  （pg_schema.sql）| （pgdb. users, orders）|
+----------------------+                          +----------------------+
       |    \                                         ^    /
       |     \                                        |   /
       |      \  3. pgloader / 手动导入 CSV/DDL         |  /
       v       \                                      | /
+----------------------+       4. 验证与测试         +----------------------+
|   PostgreSQL 目标库    |<---------------------------|   QA/开发/测试环境     |
|    （pgdb. users, orders）|                          |   （功能回归与性能验证） |
+----------------------+       5. 生产切换/监控      +----------------------+

通过上述指南，你已掌握从 MySQL 到 PostgreSQL 迁移的全流程：包括自动化迁移（pgloader）、手动迁移（DDL 转换 + CSV 导入）、数据校验、对象重写、和测试验证等关键环节。迁移后通过性能优化与监控，可以让业务平稳在 PostgreSQL 上运行。

- 阅读更多 -

MySQL MGR高可用集群搭建实战指南‌

System

2025-06-07

所有,mysql,数据库

以下内容将从概念与架构入手，逐步演示如何在三台 Linux 主机上搭建 MySQL Group Replication（简称 MGR）高可用集群。全程配有详细的配置示例、ASCII 拓扑图解以及命令演示，帮助你快速上手并深入理解。

1. 概述与背景

1.1 什么是 MySQL Group Replication

MySQL Group Replication（MGR）是 MySQL 官方提供的一种多主机间的内置复制解决方案，具备以下特性：

多主（Multi-primary）/单主（Single-primary）模式：支持所有节点均可写入（Multi-primary），也可切换为只有一个节点可写入（Single-primary）。
自动故障检测与成员剔除：一旦某个节点宕机或网络抖动，其他节点可自动剔除该节点，保持集群可用性。
一致性保证：使用 Paxos 类协议实现通信，每条事务在提交前会与大多数节点达成一致；可选基于组通信协议（XA Two-Phase Commit）保证更强一致性。
易管理：无需手动配置 master/slave 拥有者与切换，所有成员逻辑对等，自动选主或切换角色。

在 MGR 集群中，只需要向某个节点提交写请求，事务提交后会自动在组内同步，不依赖传统的主从复制拓扑。MGR 通常用于构建高度可用的数据库服务层。

1.2 集群拓扑示意（ASCII 图解）

下面以一个典型的 三节点 MGR 集群为例，展示其逻辑拓扑：

      +-----------+       +-----------+       +-----------+
      |  Node A   |       |  Node B   |       |  Node C   |
      | (MySQL)   |<----->| (MySQL)   |<----->| (MySQL)   |
      |           |       |           |       |           |
      +-----------+       +-----------+       +-----------+
           ^  ^               ^   ^               ^   ^
           |  |               |   |               |   |
      客户端读写            集群内部组通信        监控/管理

三台物理或虚拟机（节点 A、B、C），每台安装 MySQL 8.0+。
节点之间通过 XCom（组复制专用网络）进行心跳与事务流转。
客户端可分别连接到任意节点进行读写（Multi-primary 模式下），只要大多数节点在线，均可正常工作。

2. 环境与前提

2.1 环境准备

以下示例在三台 CentOS 7/8 或 Ubuntu 18.04/20.04 的服务器上演示，主机名、IP 分别如下（仅作示例，可根据实际环境修改）：

Node A
- 主机名：mysql-a
- IP：192.168.1.101
Node B
- 主机名：mysql-b
- IP：192.168.1.102
Node C
- 主机名：mysql-c
- IP：192.168.1.103

三台主机之间需保证互通，尤其是 3306/TCP（MySQL 服务）和 组复制组播端口 33061/TCP。为了简化部署可开启防火墙策略或临时关闭防火墙、Selinux。

2.2 安装 MySQL 8.0

以 CentOS 为例，可通过官方 Yum 源安装：

# 安装 MySQL 官方仓库
rpm -Uvh https://repo.mysql.com/mysql80-community-release-el7-3.noarch.rpm

# 安装 MySQL 8.0 Server
yum install -y mysql-community-server

# 启动并设置开机自启
systemctl enable mysqld
systemctl start mysqld

# 查看随机生成的 root 密码
grep 'temporary password' /var/log/mysqld.log
# 示例输出：
# 2023-10-10T12:00:00.123456Z 1 [Note] A temporary password is generated for root@localhost: AbCdEfGhIjKl

然后使用 mysql_secure_installation 初始化 root 密码并关闭不安全设置，或手动修改密码。确保三台节点都安装相同 MySQL 版本（8.0.x 相同大版本）。

2.3 主机名与 DNS 配置

为方便组复制内部通信，建议在三台服务器 /etc/hosts 中添加对应映射：

192.168.1.101   mysql-a
192.168.1.102   mysql-b
192.168.1.103   mysql-c

并设置主机名：

# 以 root 用户在各自节点执行
hostnamectl set-hostname mysql-a  # 对应节点 B、C 分别设置 mysql-b、mysql-c

确保 ping mysql-a 能够成功解析到 192.168.1.101。

3. MySQL 配置

接下来，在三台节点上分别配置 MySQL，关键在于 my.cnf 中启用 Group Replication 相关参数。

3.1 全局配置示例

在三台机器上编辑 /etc/my.cnf.d/group_replication.cnf 或 /etc/mysql/my.cnf 中增加以下内容（只需修改一份，三台均保持一致）：

# 仅示例片段，只列出关键部分
[mysqld]
# 基础属性
server_id                   = 101    # Node A 配置为 101，Node B 为 102，Node C 为 103
datadir                     = /var/lib/mysql
socket                      = /var/lib/mysql/mysql.sock
log_error                   = /var/log/mysql/error.log
pid_file                    = /var/run/mysqld/mysqld.pid
port                        = 3306

# InnoDB 相关（建议根据实际内存调整）
innodb_buffer_pool_size     = 1G
innodb_flush_log_at_trx_commit = 1
innodb_file_per_table       = 1
innodb_flush_method         = O_DIRECT

# Group Replication 组通信网络配置
# 注意：必须在三个节点上都启用 group_replication 组件
loose-group_replication_group_name = "aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee"  # 任意 UUID
loose-group_replication_start_on_boot = off
loose-group_replication_local_address = "192.168.1.101:33061"   # Node A
# Node B: "192.168.1.102:33061"; Node C: "192.168.1.103:33061"
loose-group_replication_group_seeds = "192.168.1.101:33061,192.168.1.102:33061,192.168.1.103:33061"
loose-group_replication_bootstrap_group = off

# 复制插件配置
plugin_load_add              = group_replication.so

# 日志格式与 GTID
log_slave_updates            = ON
enforce_gtid_consistency     = ON
master_info_repository       = TABLE
relay_log_info_repository    = TABLE
relay_log_recovery           = ON
transaction_write_set_extraction = XXHASH64

# binlog 与 purging
log_bin                      = mysql-bin
binlog_format                = ROW
binlog_row_image             = FULL
gtid_mode                    = ON
expire_logs_days             = 3

说明：
server_id：三台节点必须唯一；示例设置为 101、102、103。
group_replication_local_address：本机组复制监听地址，格式 IP:PORT，默认为 33061，可根据需要修改。
group_replication_group_seeds：列出所有预期参与组复制的节点地址（包括自己和对端）。
plugin_load_add = group_replication.so 加载插件。
其它 InnoDB、binlog、GTID 相关参数需保证一致，否则启动组复制时会报错。

修改完成后，重启三台节点的 MySQL 服务：

systemctl restart mysqld

3.2 验证插件是否加载

在 Node A 上登录 MySQL，执行：

mysql -uroot -p
SHOW PLUGINS\G

查看列表中是否存在 group_replication 且状态为 ACTIVE。若未加载，可执行：

INSTALL PLUGIN group_replication SONAME 'group_replication.so';

然后再次 SHOW PLUGINS 验证。

4. 初始化 MGR 集群

至此，三台节点的 MySQL 基础配置已就绪，接下来依次在每台节点上执行一系列 SQL 命令，以创建复制账户、配置组复制用户、并启动组复制。

下面示例以 Node A（IP=192.168.1.101）为例演示完整流程，并在 Node B、Node C 上做相同操作（只需要修改 server_id 与 local_address 部分）。可以通过 SSH 或 kubectl exec（若在容器中运行）连接到三台对应 MySQL 实例。

4.1 创建复制专用用户

在 任何一个节点（例如 Node A）上执行以下 SQL，为组复制创建用户，并在三台主机上都 grant 授权：

-- 登录 MySQL
mysql -uroot -p

-- 创建组复制用户（在所有节点都执行同样语句）
CREATE USER 'rpl_user'@'%' IDENTIFIED BY 'StrongRplPassw0rd!';
GRANT REPLICATION SLAVE ON *.* TO 'rpl_user'@'%';
FLUSH PRIVILEGES;

说明：
rpl_user 是组复制内部使用的账号，用于节点之间拉取 binlog。
请根据安全要求设置强密码，或改为仅在内部网段授信。

在 Node B、Node C 上都执行以上两条语句，确保三台共享相同的 rpl_user 密码与权限。

4.2 验证 GTID 设置

在三台节点上分别执行：

SHOW VARIABLES LIKE 'gtid_mode';

确认 gtid_mode = ON。若不是，请检查前面 my.cnf 中是否成功生效，重启后再次检查。

4.3 查看 InnoDB 引擎状态

确保 InnoDB 正常工作：

SHOW ENGINE INNODB STATUS\G

检查启动日志中无错误。

4.4 配置组复制相关系统变量

在 Node A 上执行（后续 B、C 同理，仅需替换 local_address）：

-- 登录 MySQL
mysql -uroot -p

-- 确保 group_replication 组件已就绪
SET GLOBAL group_replication_bootstrap_group = OFF;  -- 非启动节点必须 OFF

注意：只有在第一个节点启动时，需要将 bootstrap_group 置为 ON，而后续节点必须为 OFF。

4.5 启动首个节点（Bootstrap Group）

在 Node A 上执行以下命令，将其作为群集的“种子”节点启动组复制：

-- 登录 MySQL
mysql -uroot -p

-- 1. 确保自己是要引导的第一个成员
SET GLOBAL group_replication_bootstrap_group = ON;

-- 2. 启动组复制插件
START GROUP_REPLICATION;

-- 3. 重置 bootstrap 设置（仅当第一节点正常加入后）
SET GLOBAL group_replication_bootstrap_group = OFF;

此时，在 Node A 的 error log 中可以看到类似：

[Note] Group Replication: local member 1d0451b8-...: ONLINE, view UUID bcd123...

并执行：

SELECT * FROM performance_schema.replication_group_members;

应能看到一条记录，对应 Node A 自己，状态 ONLINE。示例输出：

+--------------------------------------+---------------+-----------------+-----------+----------------+
| MEMBER_ID                            | MEMBER_HOST   | MEMBER_PORT     | MEMBER_STATE | MEMBER_ROLE  |
+--------------------------------------+---------------+-----------------+-------------+--------------+
| 1d0451b8-85f2-11eb-912d-080027e58898 | mysql-a       | 33061           | ONLINE      | PRIMARY      |
+--------------------------------------+---------------+-----------------+-------------+--------------+

4.6 启动其余节点加入集群

节点 Node B（IP=192.168.1.102）：

确认 my.cnf 中 server_id=102，group_replication_local_address="192.168.1.102:33061"。
确认已经执行过复制账号的创建。
确保 group_replication_bootstrap_group = OFF。

登录后执行：

mysql -uroot -p

-- 启动组复制
START GROUP_REPLICATION;

然后查询：

SELECT MEMBER_HOST, MEMBER_STATE FROM performance_schema.replication_group_members;

此时可见 Node A、Node B 都已 ONLINE。类似：

+-----------+-------------+
| MEMBER_HOST | MEMBER_STATE |
+-------------+-------------+
| mysql-a     | ONLINE      |
| mysql-b     | ONLINE      |
+-------------+-------------+

重复Node C（IP=192.168.1.103）同样步骤：

mysql -uroot -p
START GROUP_REPLICATION;
SELECT MEMBER_HOST, MEMBER_STATE FROM performance_schema.replication_group_members;

期望结果：

+-----------+-------------+
| MEMBER_HOST | MEMBER_STATE |
+-------------+-------------+
| mysql-a     | ONLINE      |
| mysql-b     | ONLINE      |
| mysql-c     | ONLINE      |
+-------------+-------------+

此时，三节点 MGR 集群已建成，各自为组复制对等节点，传播事务达成一致。

5. 测试及常用操作

5.1 写入测试（Multi-primary 模式）

默认情况下，启用 MGR 后处于 Multi-primary 模式，所有节点都可写入。选择一个节点插入数据：

mysql -u root -p -h 192.168.1.101
USE testdb;
CREATE DATABASE IF NOT EXISTS testdb;
USE testdb;
CREATE TABLE t1(id INT PRIMARY KEY AUTO_INCREMENT, name VARCHAR(20));
INSERT INTO t1(name) VALUES('Alice'),('Bob');

然后在其他两个节点验证是否同步：

mysql -uroot -p -h 192.168.1.102 -e "SELECT * FROM testdb.t1;"
mysql -uroot -p -h 192.168.1.103 -e "SELECT * FROM testdb.t1;"

应都能看到两条记录。

5.2 故障测试（节点下线与自动选举）

5.2.1 模拟节点挂掉

在 Node B 上停止 MySQL 服务：

ssh root@mysql-b "systemctl stop mysqld"

此时 Node B 会被剔除组复制视图，查看任意存活节点上的成员状态：

SELECT MEMBER_HOST, MEMBER_STATE FROM performance_schema.replication_group_members;

应看到 Node B 变为 OFFLINE 或直接消失，剩余两个节点仍为 ONLINE。应用仍可继续读写。

5.2.2 恢复节点

重启 Node B MySQL：

ssh root@mysql-b "systemctl start mysqld"

之后在 Node B 上执行：

mysql -uroot -p
START GROUP_REPLICATION;

Node B 会自动拉取最新事务并回到 ONLINE 状态。最终再查询视图：

SELECT MEMBER_HOST, MEMBER_STATE FROM performance_schema.replication_group_members;

即可看到三节点均为 ONLINE。

5.3 单主模式（Single-primary）切换

若希望整个集群只有一个节点可写入，其他节点只做只读，可在任一节点执行：

-- 将集群切换为 Single-primary
mysql> SET GLOBAL group_replication_single_primary_mode = ON;

-- 在当前节点设置其为 PRIMARY
mysql> SELECT MEMBER_HOST, MEMBER_ROLE FROM performance_schema.replication_group_members;
-- 如果当前节点不是 PRIMARY，执行：
mysql> SET GLOBAL group_replication_primary_member = 'mysql-a:33061';

此后，在 PRIMARY 节点上可执行写操作；在其他节点若尝试写，会报 “Write operations are not allowed in secondary mode” 错误。

要恢复多主模式，执行：

SET GLOBAL group_replication_single_primary_mode = OFF;

6. 常见问题与排查

在实际部署与运行中，可能会遇到以下常见问题，结合对应排查思路快速定位与解决。

6.1 无法加入集群：`Member X requested state CHANGE but cannot change to JOINED`

问题症状

启动第二个节点时，在 error log 中看到：

[ERROR] Group Replication: Member jklmn cannot join group.
Member jklmn requested state CHANGE but cannot change to JOINED

排查思路

检查网络互通：确保 33061 端口在防火墙或安全组中已开放。
检查账号授权：确认 rpl_user@'%' 在所有节点上已创建且拥有 REPLICATION SLAVE 权限，且密码一致。
检查配置文件差异：
- group_replication_group_seeds 是否包含正确的所有节点地址。
- server_id、gtid_mode、binlog_format、transaction_write_set_extraction 等必须保持一致。
查看 error log 详细信息：
```
grep -i "replication" /var/log/mysql/error.log
```
根据提示进一步定位。

6.2 写入失败：`ERROR 1845 (HY000): Access denied for user 'rpl_user'@'...'`

问题症状

在 Node B 或 C 启动组复制时，报 Access denied 错误，提示 rpl_user 认证失败。

排查思路

确认复制用户密码一致：在各节点上测试：
```
mysql -urpl_user -pStrongRplPassw0rd! -h 192.168.1.101 -e "SELECT 1;"
```
若密码错误，应在所有节点上重新 ALTER USER 'rpl_user'@'%' IDENTIFIED BY '...' 并 FLUSH PRIVILEGES;。
检查用户 Host 授权：如果授权给特定 IP，如 @'192.168.1.%'，需确认 rpl_user 在目标节点访问时 Host 匹配。
确认 skip_name_resolve：若在 my.cnf 中启用了 skip_name_resolve=ON，则需用纯 IP 授权（'rpl_user'@'192.168.1.101'），否则解析 Hostname 可能出错。

6.3 数据冲突：`Caught exception: Group Replication conflict with ...`

问题症状

在多主模式下，如果两台节点同时写入同一个主键，某节点可能会报冲突错误：

ERROR 1644 (ER_SIGNAL_EXCEPTION): Caught exception: Group Replication conflict...

解释与建议

这是内置冲突检测机制，当不同节点对同一行执行不一致写时，会在某个节点检测到冲突，并回滚该事务。
解决方案：尽量将同一数据写负载通过 Proxy 分流，或者在业务层面做分布式 ID 生成（如使用 UUID、雪花算法）避免主键冲突。
若业务允许一次写冲突回滚，再重试即可；否则需改为单主写或分库分表。

6.4 节点下线后无法恢复：`Member X is not found in the group view`

问题症状

某节点宕机后重启，执行 START GROUP_REPLICATION 时，报错提示该节点未在组视图中。

排查思路

检查 View 信息：
在存活节点上：
```
SELECT * FROM performance_schema.replication_group_members;
```
确认视图中是否还存在该节点的记录，状态是否为 OFFLINE。
尝试更新组成员配置：
如果视图中没有该节点记录，可能是 group_replication_member_expel_timeout 导致节点被踢出后未重新加入。

强制清理旧成员信息：
在目标节点上执行：

STOP GROUP_REPLICATION;
RESET MASTER;  -- 若 GTID 与日志冲突，可考虑清空 binlog
SET GLOBAL group_replication_bootstrap_group = OFF;
START GROUP_REPLICATION;

或在存活节点上先使用：

-- 标记该节点为离线并剔除
CALL mysql.rds_kill_master('mysql-c', 3306);

再让目标节点重新启动加入。

7. 管理与监控

为了保证 MGR 集群长期稳定运行，需要借助一些监控与运维手段。

7.1 查看组复制状态

7.1.1 成员视图

SELECT 
    MEMBER_ID, 
    MEMBER_HOST, 
    MEMBER_PORT, 
    MEMBER_STATE, 
    MEMBER_ROLE
FROM performance_schema.replication_group_members;

MEMBER\_STATE: ONLINE、OFFLINE、RECOVERING 等。
MEMBER\_ROLE: PRIMARY（当前写入节点）或 SECONDARY（只读节点）。

7.1.2 插件状态

SHOW STATUS LIKE 'group_replication_%';

常用字段：

group_replication_primary_members: 当前 PRIMARY 节点列表
group_replication_local_state: 本地节点状态
group_replication_group_size: 组内成员数

7.2 高可用监控与自动故障转移

MGR 本身可自动剔除故障节点，但故障节点恢复后不会自动重新加入，需要人工或脚本触发重新 START GROUP_REPLICATION。可以编写如下简易脚本，在节点重启后自动尝试加入：

#!/bin/bash
# mgr_auto_rejoin.sh
MYSQL_USER="root"
MYSQL_PASS="YourRootPasswd"

# 检查本机组复制状态
STATUS=$(mysql -u${MYSQL_USER} -p${MYSQL_PASS} -e "SELECT VARIABLE_VALUE FROM performance_schema.global_status WHERE VARIABLE_NAME='group_replication_local_state'" -s -N)

if [ "$STATUS" != "ONLINE" ]; then
    echo "本节点非 ONLINE，尝试重新加入集群..."
    mysql -u${MYSQL_USER} -p${MYSQL_PASS} -e "START GROUP_REPLICATION;"
    sleep 5
    NEW_STATUS=$(mysql -u${MYSQL_USER} -p${MYSQL_PASS} -e "SELECT VARIABLE_VALUE FROM performance_schema.global_status WHERE VARIABLE_NAME='group_replication_local_state'" -s -N)
    if [ "$NEW_STATUS" == "ONLINE" ]; then
        echo "节点成功重新加入 GROUP."
    else
        echo "重试失败，当前状态：$NEW_STATUS"
    fi
else
    echo "本节点已经在线，无需操作."
fi

可将此脚本放在节点启动后执行（如 crontab 或 systemd service），自动检测并加入集群。

8. 拓展：ZooKeeper vs Group Replication

虽然本指南专注于 MySQL 官方 MGR，但在生产环境中也常见 基于 Galera（MariaDB/Galera Cluster）或 使用 ZooKeeper 协调 的高可用方案。MGR 与它们相比的优缺点：

MGR 优点
- 原生集成 MySQL，无需额外安装 Galera 库或外部协调组件（如 ZooKeeper）。
- 使用 GTID 保证全局唯一性与一致性。
- 多主写入、自动故障剔除，可选单主模式。
MGR 缺点
- 对网络延迟敏感，推荐节点间 RTT < 5ms。
- 写冲突处理需额外关注，可能导致事务回滚。
- 配置相对复杂，资源消耗较高。
Galera 优点
- 同样支持多主热备，且同步延迟近乎为 0。
- 社区成熟，文档与平台兼容性好。
Galera 缺点
- 需安装额外 Galera 插件，且与 MySQL 官方主线版本存在分支差异。
- 对大事务群集通信压测存在瓶颈。

若已有 ZooKeeper/Kafka 等组件，或已使用 Kubernetes Operator（如 Oracle MySQL Operator 或 Vitess）管理 MGR，可考虑更进一步自动化部署与运维。

9. 小结

本文通过一个三节点的实战演练，详细介绍了：

MySQL MGR 基本概念与优势
环境与前提准备：主机名、网络互通、安装 MySQL、配置 my.cnf
创建复制用户与 GTID 设置
在三台节点上加载 group_replication 插件
在 Node A 上引导集群（bootstrap）并在 Node B、C 上加入
读写测试、节点故障验证与恢复
单主/多主模式切换、常见问题排查与自动 rejoin 脚本
对比 Galera/其他 HA 方案，帮助你理解选型依据

通过本指南，你应该能在自己的实验环境或生产环境中快速搭建一个高可用的 MySQL MGR 集群，并掌握基本的运维与故障排查方法。后续可结合 Kubernetes Operator、ProxySQL 等组件，进一步实现自动化部署、读写分离与流量监控，实现更完善的 HA 架构。

- 阅读更多 -

MySQL角色权限管理深度剖析：从创建到应用‌

System

2025-06-07

所有,mysql,数据库

本文将从 MySQL 角色权限管理（Role-Based Access Control，RBAC）的原理入手，逐步讲解如何创建角色、分配权限、将角色赋予用户，以及常见的应用场景与最佳实践。全程配合丰富的 SQL 代码示例、ASCII 图解、以及 详细说明，帮助你对 MySQL 角色权限管理有更清晰的认识与实操能力。

1. 概述：为什么要使用角色管理

在生产环境中，数据库用户众多且业务复杂，直接对每个用户单独进行权限配置会带来如下痛点：

权限混乱：同一类用户可能需要相同的权限，但若对每个用户都做一遍 GRANT/LIST，后期运维难以统一管理。
安全风险：若某个用户离职或发生权限变更，需要手动撤销该用户的所有权限，容易遗漏，导致潜在安全隐患。
权限演变难追踪：业务不断发展，权限需要随之调整，单独修改每个用户耗时耗力。

❗MySQL 8.0+ 引入了“角色”（Role）概念，将一组权限 封装成角色，可以一次性将角色赋给多个用户，简化权限管理流程。使用角色后，典型流程如下：

创建角色（Role）：将常见的权限集合打包。
为角色授权：一次性向角色分配所需权限。
为用户分配角色：将角色赋给用户，用户即拥有该角色的所有权限。
动态切换默认角色/启用角色：控制用户在会话层面启用哪些角色（有助于最小权限原则）。

下图示意了角色与用户、权限的关系：

+----------------------+      +----------------------+
|      ROLE_admin      |      |      ROLE_readonly   |
|  (SELECT, UPDATE,    |      | (SELECT ON db.*)     |
|   CREATE, DROP, ...) |      +----------------------+
+-----------+----------+                ^
            |                           |
            |                           |
       ASSIGNED TO                   ASSIGNED TO
            |                           |
  +---------v---------+         +-------v---------+
  |     USER_alice    |         |    USER_bob     |
  | (default roles:   |         |  (default role: |
  |  ROLE_admin)      |         |   ROLE_readonly)|
  +-------------------+         +-----------------+

ROLE_admin 和 ROLE_readonly 是两个角色，分别封装不同权限。
USER_alice 通过分配了 ROLE_admin 拥有管理员权限；USER_bob 拥有只读权限。

2. MySQL 权限系统简要回顾

在 MySQL 中，所有授权记录保存在 mysql 数据库的系统表里，包括：

mysql.user：全局用户级别权限（如 GRANT OPTION、CREATE USER、CREATE TABLESPACE 等）。
mysql.db / mysql.tables_priv / mysql.columns_priv / mysql.procs_priv：分别存储数据库、表、列、存储过程/函数级别的权限。
mysql.role_edges：存储角色之间、角色与用户之间的关联。
mysql.role_edges（自 MySQL 8.0 引入） + 视图 information_schema.enabled_roles / information_schema.role_table_grants / information_schema.role_routine_grants 等，方便查询角色相关信息。

在无角色的场景下，对用户授权通常采用以下步骤：

CREATE USER 'alice'@'%' IDENTIFIED BY 'pwd';
GRANT SELECT, INSERT ON db1.* TO 'alice'@'%';
GRANT UPDATE ON db1.table1 TO 'alice'@'%';
FLUSH PRIVILEGES;

随着业务增长，每个新用户都要重复上述操作，极不便捷。引入角色后，可将第一步和第二步分离：

先创建角色（只需做一次）。
再将角色赋给不同用户（若多个用户需相同权限，只需赋相同角色即可）。

3. 角色基础概念与语法

3.1 角色（Role）的本质

角色只是一个特殊的“虚拟用户”，它本身不用于登录，只负责承载权限。
对角色进行授权（GRANT 权限到角色），而后再将角色“授予”给实际的用户。用户会“继承”所分配角色的权限。
可以创建多个角色并形成层级关系（角色 ↔ 角色），实现权限的更细粒度组合与复用。

3.2 角色的生命周期

创建角色：CREATE ROLE rolename;
向角色授予权限：GRANT privilege ON resource TO rolename;
将角色分配给用户：GRANT rolename TO username;
给用户启用/禁用默认角色：SET DEFAULT ROLE rolename TO username; 或 SET ROLE rolename;
撤销角色权限 / 撤销用户角色关联：相应使用 REVOKE 语句
删除角色：DROP ROLE rolename;

下文将结合示例逐一说明。

4. 创建角色并授予权限

以下示例均基于 MySQL 8.0+，假设已使用具有 CREATE ROLE 权限的账号登陆（通常是具有 GRANT OPTION 或 CREATE USER 权限的管理员账号）。

4.1 创建角色

-- 创建一个名为 'developer' 的角色
CREATE ROLE developer;

-- 批量创建多个角色，一次性逗号分隔
CREATE ROLE admin, readonly_user, analyst;

如果角色已存在，会报错。可用 CREATE ROLE IF NOT EXISTS ... 来避免错误：
```
CREATE ROLE IF NOT EXISTS devops;
```

4.2 授予权限给角色

创建好角色以后，需要向角色分配具体的权限。注意：此时并不涉及任何用户，只是简单地将权限“授予”给角色。

4.2.1 数据库级别授权

-- 将 SELECT、INSERT、UPDATE 授予给 developer 角色，作用于所有 db1.* 表
GRANT SELECT, INSERT, UPDATE
  ON db1.* 
  TO developer;

db1.* 表示该角色在 db1 库下的所有表拥有 SELECT、INSERT、UPDATE 权限。
可多次调用 GRANT，累积权限。例如：
```
GRANT DELETE, DROP ON db1.* TO developer;
```

4.2.2 表级别与列级别授权

-- 将 SELECT、UPDATE 授予给某个表的部分列
GRANT SELECT (col1, col2), UPDATE (col2)
  ON db1.table1
  TO analyst;

-- 将 SELECT ON db2.table2 授予给 readonly_user
GRANT SELECT ON db2.table2 TO readonly_user;

列级别授权：在 (col1, col2) 中列出具体列。
如果不指定列，默认作用于表中所有列。

4.2.3 存储过程/函数级别授权

-- 对存储过程proc_generate_report授权 EXECUTE 权限
GRANT EXECUTE
  ON PROCEDURE db1.proc_generate_report
  TO analyst;

4.2.4 全局级别授权

-- 将 CREATE USER、INSERT、UPDATE、DELETE 等全局权限授予给 admin 角色
GRANT CREATE USER, PROCESS, RELOAD
  ON *.*
  TO admin;

ON *.* 表示全局作用，对所有数据库和所有表生效。
谨慎使用全局权限，仅限 DBA/超级角色使用。

4.3 验证角色拥有的权限

可使用 SHOW GRANTS FOR role_name; 查看角色持有的权限。例如：

SHOW GRANTS FOR developer;

输出示例：

+------------------------------------------------------+
| Grants for developer@%                              |
+------------------------------------------------------+
| GRANT `SELECT`, `INSERT`, `UPDATE` ON `db1`.* TO `developer` |
| GRANT `DELETE`, `DROP` ON `db1`.* TO `developer`     |
+------------------------------------------------------+

如果需要查看更细粒度信息，也可通过 information_schema.role_table_grants、information_schema.role_routine_grants 等视图查询。

5. 将角色分配给用户

角色创建并授予权限后，就可以将角色授权给用户，让用户“继承”角色的所有权限。

5.1 将角色赋予用户

-- 将 developer 角色分配给用户 alice
GRANT developer TO 'alice'@'%';

-- 同时赋予多个角色给同一个用户
GRANT developer, analyst TO 'bob'@'192.168.1.%';

GRANT role_name TO user_name 语句会在系统表 mysql.role_edges 写入关联关系：角色 ↔ 用户。
MySQL 中，角色名与用户标识符同在一个命名空间，但角色不能用于登录。用户只能使用 CREATE USER 创建，而角色只能使用 CREATE ROLE 创建。

5.2 设置默认角色

当用户拥有多个角色时，登录后要“启用”哪些角色才能真正生效？MySQL 支持为用户设置“默认角色”，即在用户登录时，哪些角色自动被启用（ENABLE）。

查看用户当前拥有的角色：

-- 查询 user_alice 拥有的角色
SELECT 
  ROLE,  
  IS_DEFAULT  
FROM mysql.role_edges  
WHERE TO_USER = 'alice' AND TO_HOST = '%';

或者：

SELECT * FROM information_schema.enabled_roles 
WHERE GRANTEE = "'alice'@'%'";

将某个角色设置为默认角色：

-- 让 alice 登录时默认启用 developer
SET DEFAULT ROLE developer TO 'alice'@'%';

将多个角色设置为默认角色：

SET DEFAULT ROLE developer, analyst TO 'bob'@'192.168.1.%';

将默认角色全部禁用（登录后用户需要手动使用 SET ROLE 才能启用）：
```
SET DEFAULT ROLE NONE TO 'alice'@'%';
```

查看当前默认角色：

SELECT DEFAULT_ROLE  
FROM information_schema.user_privileges  
WHERE GRANTEE = "'alice'@'%'";

5.3 手动启用/切换角色

在某些场景下，用户登录后想临时启用或者切换到其它角色，可以使用 SET ROLE 命令。

-- 启用 developer 角色
SET ROLE developer;

-- 启用多个角色
SET ROLE developer, analyst;

-- 禁用当前所有角色，相当于只保留自己帐号的直接权限
SET ROLE NONE;

-- 查看当前启用的角色
SELECT CURRENT_ROLE();

5.3.1 示例流程

假设用户 charlie 被授予了 developer 和 readonly_user 两个角色，但默认只设为 readonly_user：

-- 授予角色
GRANT developer TO 'charlie'@'%';
GRANT readonly_user TO 'charlie'@'%';

-- 设定默认只启用 readonly_user
SET DEFAULT ROLE readonly_user TO 'charlie'@'%';

charlie 登录后，系统自动只启用 readonly_user 角色，拥有只读权限。
若要执行写操作（需要 developer 角色），在会话中执行：
```
SET ROLE developer;
```
此时同时保留了readonly_user的权限，也启用了developer，拥有读写权限。
如果执行完写操作后需要切换回只读环境，可以运行：
```
SET ROLE readonly_user;
```
也可用：
```
SET ROLE NONE;
```
恢复为只保留直接授予用户的权限（若未直接对用户授予任何权限，则相当于无权限）。

6. 撤销角色与权限

在运维过程中，可能需要撤销角色中的某些权限、将角色与用户解绑，或删除角色本身。

6.1 从角色中撤销权限

与 GRANT … TO role 对应，使用 REVOKE 撤销角色上的权限。例如：

-- 从 developer 角色撤销 DELETE 权限
REVOKE DELETE ON db1.* FROM developer;

-- 从 readonly_user 角色撤销对 db2.table2 的 SELECT 权限
REVOKE SELECT ON db2.table2 FROM readonly_user;

REVOKE privilege ON resource FROM role_name;
如果角色不再持有任何权限，可以考虑直接删除角色（下一节）。

6.2 从用户撤销角色

-- 将 developer 角色从 alice 身上撤销
REVOKE developer FROM 'alice'@'%';

-- 一次性撤销多个角色
REVOKE developer, analyst FROM 'bob'@'192.168.1.%';

REVOKE role_name FROM user_name; 会删除系统表 mysql.role_edges 中的对应记录，用户不再继承该角色的权限。
如果想将用户的所有角色一次性撤销，可以：
```
REVOKE ALL ROLES FROM 'alice'@'%';
```

6.3 删除角色

当一个角色不再需要时，可以将其彻底删除。

-- 删除角色
DROP ROLE developer;

-- 如果要删除多个角色
DROP ROLE developer, analyst, readonly_user;

在删除角色之前，建议先确认已将角色从所有用户身上撤销 (REVOKE <role> FROM ALL)。
如果角色仍被某些用户拥有，删除时会将关联一并删除，但需谨慎操作，避免用户瞬间失去权限。

7. 角色与角色之间的嵌套（层级角色）

MySQL 支持将一个角色赋予另一个角色，从而形成层级（继承）的关系。这样可以将常见权限归纳到多个“父角色”，再让“子角色”继承，达到权限复用与拆分的目的。

    +----------------------+
    |    ROLE_sysadmin     |
    | (CREATE USER, DROP   |
    |  PERSISTED, RELOAD)  |
    +----------+-----------+
               |
        GRANT TO v
               |
    +----------v-----------+
    |    ROLE_devops       |
    | (继承 sysadmin +    |
    |   SELECT, INSERT)   |
    +----------+-----------+
               |
         GRANT TO v
               |
    +----------v-----------+
    |    ROLE_developer    |
    | (继承 devops +       |
    |   SELECT, UPDATE)    |
    +----------------------+

7.1 将角色授权给角色

-- 第一步：创建三个角色
CREATE ROLE sysadmin, devops, developer;

-- 给 sysadmin 授予全局管理权限
GRANT CREATE USER, RELOAD, PROCESS ON *.* TO sysadmin;

-- 给 devops 授予 SELECT、INSERT 权限
GRANT SELECT, INSERT ON devdb.* TO devops;

-- 给 developer 授予 UPDATE 权限
GRANT UPDATE ON devdb.* TO developer;

-- 第二步：设置角色层级关系
-- 让 devops 角色继承 sysadmin
GRANT sysadmin TO devops;

-- 让 developer 角色继承 devops
GRANT devops TO developer;

上述操作后，developer 角色将拥有：
1. UPDATE ON devdb.*（自身权限）
2. SELECT, INSERT ON devdb.*（来自 devops）
3. CREATE USER, RELOAD, PROCESS（来自 sysadmin）

7.2 验证角色层级关系

可通过 SHOW GRANTS FOR devops; 看到 devops 本身权限以及继承自 sysadmin 的权限。

也可查询系统表：

SELECT * 
  FROM mysql.role_edges 
 WHERE FROM_USER = 'sysadmin' OR FROM_USER = 'devops';

示例返回：

+-----------+----------+-------------+---------+
| FROM_HOST | FROM_USER| TO_HOST     | TO_USER |
+-----------+----------+-------------+---------+
| %         | sysadmin | %           | devops  |
| %         | devops   | %           | developer |
+-----------+----------+-------------+---------+

表示 sysadmin → devops，devops → developer。

8. 会话级别角色启用与安全考虑

8.1 会话中启用/禁用角色的安全策略

在某些安全敏感场景下，希望用户默认只能使用最少权限，只有在特定会话中才会启用更高权限的角色。这可以通过如下方式实现：

设置默认角色为空：
```
SET DEFAULT ROLE NONE TO 'dba_user'@'%';
```
这样 dba\_user 登录后没有任何角色启用，只拥有直接授予该用户的权限（通常是极少权限）。

在需要权限时，手动启用角色：

-- 登录后
SET ROLE admin;  -- 启用 admin 角色

会话结束后角色失效：
下次 dba\_user 登录时，依然无角色启用，需要再次手动 SET ROLE admin;。

8.2 最小权限原则与审计

原则：尽量让用户只获取完成对应任务的最小权限，不要赋予过多全局或敏感权限。
使用角色便于审计：可以在审计审查时，只需查看哪个用户被授予了哪个角色，而非查看每个用户的所有权限。
禁止随意赋予 GRANT OPTION：避免用户自行再向他人分配/创建角色。只有少数超级管理员角色才应拥有 GRANT OPTION 权限。

9. 查询与维护角色权限信息

MySQL 提供了多种方式来查看角色、用户与权限之间的映射、以及角色本身的权限。

9.1 查看角色持有的权限

SHOW GRANTS FOR 'developer'@'%';

会列出所有针对 developer 角色的授权（包括直接授权和继承授权）。

9.2 查看用户拥有的角色

-- 查看 alice 拥有的角色以及是否为默认角色
SELECT 
    FROM_USER AS role_name, 
    IS_DEFAULT 
FROM mysql.role_edges 
WHERE TO_USER = 'alice' AND TO_HOST = '%';

或通过视图：

SELECT ROLE, IS_DEFAULT
  FROM information_schema.enabled_roles
 WHERE GRANTEE = "'alice'@'%'";

9.3 查看用户继承的所有权限

SHOW GRANTS FOR 'alice'@'%';

该命令会同时列出 alice 的直接权限、通过角色继承的权限，以及角色层级继承的权限，便于综合查看。

9.4 查看角色层级关系

SELECT 
    FROM_USER AS parent_role, 
    TO_USER   AS child_role
FROM mysql.role_edges
WHERE FROM_USER IN ('sysadmin','devops','developer', ...);

通过 mysql.role_edges 可以可视化角色之间的继承关系，有助于把握角色层级结构。

10. 常见应用场景示例

下面通过几个典型场景，演示角色权限管理在实际项目中的应用。

10.1 场景一：开发/测试/生产环境隔离

需求：同一个应用在开发测试环境和生产环境使用同一个数据库账号登录，为了安全，生产环境账号不允许执行 DDL，只能读写特定表；开发环境账号可以执行 DDL、调试函数等。

10.1.1 设计角色

role_prod_rw：生产环境读写角色，只允许 SELECT, INSERT, UPDATE, DELETE 。
role_dev_all：开发环境角色，除了上面操作，还需 CREATE, DROP, ALTER 等 DDL 权限。

-- 创建角色
CREATE ROLE role_prod_rw, role_dev_all;

-- 为 role_prod_rw 授权只读写权限
GRANT SELECT, INSERT, UPDATE, DELETE
  ON appdb.* 
  TO role_prod_rw;

-- 为 role_dev_all 授权所有权限（谨慎）
GRANT ALL PRIVILEGES 
  ON appdb.* 
  TO role_dev_all;

10.1.2 赋予给用户

-- 生产账号 prod_user 只拥有 role_prod_rw
GRANT role_prod_rw TO 'prod_user'@'%';
SET DEFAULT ROLE role_prod_rw TO 'prod_user'@'%';

-- 开发账号 dev_user 拥有 dev_all 和 prod_rw（方便与生产数据同步）
GRANT role_dev_all, role_prod_rw TO 'dev_user'@'%';
SET DEFAULT ROLE role_dev_all TO 'dev_user'@'%';

prod_user 登录后自动启用 role_prod_rw，只能做增删改查。
dev_user 登录后自动启用 role_dev_all，拥有完整权限，可执行表结构变更、存储过程调试等。

10.2 场景二：分离业务功能与审计需求

需求：数据库中有多个业务模块，每个模块对应一个数据库，比如 sales_db、hr_db。有些用户只需要访问 sales_db，有些只访问 hr_db；此外，需要一个 auditor 角色，只能读取所有库但不能修改。

10.2.1 创建与授权

-- 创建业务角色
CREATE ROLE role_sales, role_hr;

-- 创建审计角色
CREATE ROLE role_auditor;

-- role_sales 只读写 sales_db
GRANT SELECT, INSERT, UPDATE, DELETE
  ON sales_db.* 
  TO role_sales;

-- role_hr 只读写 hr_db
GRANT SELECT, INSERT, UPDATE, DELETE
  ON hr_db.* 
  TO role_hr;

-- role_auditor 只读所有库
GRANT SELECT 
  ON *.* 
  TO role_auditor;

10.2.2 将角色赋给用户

-- 销售部门用户
GRANT role_sales TO 'sales_user'@'%';
SET DEFAULT ROLE role_sales TO 'sales_user'@'%';

-- HR 部门用户
GRANT role_hr TO 'hr_user'@'%';
SET DEFAULT ROLE role_hr TO 'hr_user'@'%';

-- 审计用户
GRANT role_auditor TO 'auditor1'@'%';
SET DEFAULT ROLE role_auditor TO 'auditor1'@'%';

10.3 场景三：多租户隔离+管理员分级

需求：一个多租户系统，中控管理员可以看到所有租户的数据；租户管理员只可管理本租户的数据；租户用户只能访问自己对应表的数据。

10.3.1 设计角色

+----------------+       +----------------+       +----------------+
|  role_superadmin |     | role_tenant_admin |     | role_tenant_user |
+----------------+       +----------------+       +----------------+
        |                        |                         |
        |                        |                         |
        v                        v                         v
+--------------------------------+            +----------------+
|        role_common_read        |            | role_tenant_specific |
+--------------------------------+            +----------------+

role_common_read：只读全库视图、公共表、系统表。
role_tenant_admin：继承 role_common_read，并可以对本租户库进行 DDL/DML 操作。
role_tenant_user：继承 role_common_read，只可 SELECT 本租户的业务表。
role_superadmin：继承上述两个角色，并拥有全局管理权限。

10.3.2 授权示例

-- 创建基础角色
CREATE ROLE role_common_read, 
            role_tenant_admin, 
            role_tenant_user, 
            role_superadmin;

-- role_common_read：只读公共表、系统表
GRANT SELECT ON mysql.* TO role_common_read;
GRANT SELECT ON information_schema.* TO role_common_read;
GRANT SELECT ON performance_schema.* TO role_common_read;
-- … 其他公共库视图

-- role_tenant_user：继承 role_common_read，增加本租户业务表 SELECT
GRANT role_common_read TO role_tenant_user;
GRANT SELECT ON tenant1_db.* TO role_tenant_user;

-- role_tenant_admin：继承 role_tenant_user，增加对本租户库的 DML/DDL
GRANT role_tenant_user TO role_tenant_admin;
GRANT INSERT, UPDATE, DELETE, CREATE, ALTER, DROP ON tenant1_db.* TO role_tenant_admin;

-- role_superadmin：继承 role_common_read + role_tenant_admin，及全局权限
GRANT role_common_read, role_tenant_admin TO role_superadmin;
GRANT CREATE USER, GRANT OPTION, RELOAD ON *.* TO role_superadmin;

10.3.3 分配给用户

-- 租户用户
GRANT role_tenant_user TO 'tenant1_user'@'%';
SET DEFAULT ROLE role_tenant_user TO 'tenant1_user'@'%';

-- 租户管理员
GRANT role_tenant_admin TO 'tenant1_admin'@'%';
SET DEFAULT ROLE role_tenant_admin TO 'tenant1_admin'@'%';

-- 超级管理员
GRANT role_superadmin TO 'global_admin'@'%';
SET DEFAULT ROLE role_superadmin TO 'global_admin'@'%';

tenant1_user 登录后只能读 tenant1_db.*，并能读取公共库；无法做任何写操作。
tenant1_admin 登录后可以对 tenant1_db 做增删改、DDL 操作，也能读取公共库。
global_admin 登录后拥有所有租户库的管理权限（因继承了 role_tenant_admin）、以及全局用户管理权限。

11. 常见问题与注意事项

MySQL 版本兼容
- 角色功能从 MySQL 8.0.0 开始支持。若使用 5.7 或更早版本，只能使用传统用户+权限方式，不支持角色语法。
- 在代码部署时需注意目标服务器 MySQL 版本，避免使用 CREATE ROLE 等不兼容语句。
角色名与用户重名冲突
- MySQL 角色和用户共享同一命名空间，角色名不能与已存在的用户名相同，否则会报错。
- 建议为角色统一使用前缀（例如 role_），避免与实际用户名冲突。
角色的“启用状态”
- 用户不执行 SET ROLE 时，仅拥有“默认角色”或直接授予给用户的权限，其余角色暂不启用。
- 有些项目会将敏感权限分配给某些角色，再为用户不设默认角色（SET DEFAULT ROLE NONE），登录后再手动 SET ROLE 才启用，以便最小权限原则。
审计和权限变更跟踪
- 尽量通过版本化脚本来管理角色与权限变更，避免手动在生产环境乱改，保证可回滚。
- 建议定期导出 SHOW GRANTS 信息，或者通过 mysql.role_edges、mysql.user 等表进行审计，防止权限漂移。
角色层级设计需谨慎
- 角色继承链过深会导致审计和理解困难，建议最多保留两层（如 role_A → role_B → user）。
- 每个角色尽量只封装一类业务或职能，避免“万能角色”带来权限膨胀。
重置/删除角色注意
- 若要删除某个角色，务必先用 REVOKE <role> FROM ALL 将其与所有用户、角色解绑，避免出现“悬空”引用。
- 删除后，相关用户将失去该角色对应的所有权限，请提前通知并做好备份。

12. ASCII 图解：MySQL 角色权限管理全流程

以下 ASCII 图示描述了一个典型的角色权限管理流程，从角色创建、授权、到用户使用的全过程。

┌─────────────────────────────────────────────────────────────┐
│  管理员 (root 或有 CREATE ROLE 权限账号)                    │
│                                                             │
│  1. 创建角色：                                              │
│     CREATE ROLE admin, developer, readonly_user;            │
│                                                             │
│  2. 将权限授予角色：                                        │
│     GRANT ALL ON *.* TO admin;                               │
│     GRANT SELECT, INSERT, UPDATE ON business_db.* TO developer; │
│     GRANT SELECT ON business_db.* TO readonly_user;          │
│                                                             │
│  3. 配置角色层级（可选）：                                   │
│     GRANT admin TO developer;  -- developer 继承 admin 的部分权限│
│                                                             │
│  4. 将角色分配给用户：                                      │
│     CREATE USER 'alice'@'%';                                 │
│     CREATE USER 'bob'@'%';                                   │
│     GRANT developer TO 'alice'@'%';                           │
│     GRANT readonly_user TO 'bob'@'%';                         │
│                                                             │
│  5. 设置默认角色：                                          │
│     SET DEFAULT ROLE developer TO 'alice'@'%';                │
│     SET DEFAULT ROLE readonly_user TO 'bob'@'%';              │
└─────────────────────────────────────────────────────────────┘
                │                         │
                │ alice 登录               │ bob 登录
                ▼                         ▼
   ┌───────────────────────────┐   ┌───────────────────────────┐
   │ 会话 (alice @ %)          │   │ 会话 (bob @ %)            │
   │                           │   │                           │
   │ 默认角色：developer       │   │ 默认角色：readonly_user   │
   │                           │   │                           │
   │ 权限继承：                 │   │ 权限继承：                 │
   │   - SELECT,INSERT,UPDATE   │   │   - SELECT                 │
   │     ON business_db.*       │   │     ON business_db.*       │
   │   - （若开发者有继承 admin:  │   │                           │
   │      额外权限）             │   │                           │
   │                           │   │                           │
   │ 用户操作：                 │   │ 用户操作：                 │
   │   - 执行 DML、DDL 等        │   │   - 只能执行 SELECT        │
   │                           │   │                           │
   └───────────────────────────┘   └───────────────────────────┘

管理员先 创建角色，再 授权给角色，然后 为用户分配角色，最后 设置默认角色。
用户登录后，即自动拥有所分配角色的所有权限；若需要切换角色，可通过 SET ROLE 完成。

13. 常见操作小结

操作场景	SQL 示例	说明
创建角色	`CREATE ROLE rolename;`	创建一个空角色，尚无权限
删除角色	`DROP ROLE rolename;`	删除角色
查看角色权限	`SHOW GRANTS FOR rolename;`	列出角色被授予的所有权限
授予权限给角色	`GRANT SELECT, INSERT ON db.* TO rolename;`	将权限绑定到角色
撤销角色上的权限	`REVOKE DELETE ON db.* FROM rolename;`	从角色上移除指定权限
将角色授予用户	`GRANT rolename TO 'user'@'host';`	用户将继承该角色所有权限
从用户撤销角色	`REVOKE rolename FROM 'user'@'host';`	移除用户对该角色的继承
设置默认角色	`SET DEFAULT ROLE rolename TO 'user'@'host';`	用户登录后自动启用的角色
查看用户拥有的角色	`SELECT ROLE,IS_DEFAULT FROM mysql.role_edges WHERE TO_USER='user';` 或 `SELECT * FROM information_schema.enabled_roles WHERE GRANTEE="'user'@'host'";`	查询用户当前拥有的角色及默认角色信息
会话中启用/切换角色	`SET ROLE rolename;`	切换会话中启用的角色
会话中禁用所有角色	`SET ROLE NONE;`	取消会话中所有角色启用，保留用户直接赋予的权限
查询用户所有权限（含角色）	`SHOW GRANTS FOR 'user'@'host';`	列出用户直接权限与继承自角色的权限
查看角色层级关系	`SELECT * FROM mysql.role_edges;`	查看角色 ↔ 角色，角色 ↔ 用户之间的关联

14. 小结与最佳实践

统一封装权限到角色，减少重复
- 建议不要直接对普通用户做大量 GRANT，而是将常见的一组权限先封装成“角色”，再授予给用户。便于统一管理与审计。
命名规范
- 角色名统一加前缀（如 role_），避免与用户名冲突；用户账号可用业务含义命名（如 app_service, audit_user）。
最小权限原则
- 每个角色只封装执行某项任务所需的最低权限，避免过度授权。
- 针对敏感操作（如全库 DDL、用户管理），创建独立的管理员角色，仅授予给极少数超级账号。
使用默认角色与会话切换
- 对于某些高权限角色，设置为“非默认角色”，只在必要时手动启用，降低长期风险。
定期巡检与审计
- 定期执行 SHOW GRANTS FOR、查询 mysql.role_edges 等，确保权限分配符合预期，无越权用户；
- 可结合自动化脚本，将角色与用户、权限信息导出，以便存档与回溯。
版本化管理角色脚本
- 将所有涉及 CREATE ROLE、GRANT … TO role、GRANT role TO user 等脚本纳入版本控制，与应用部署流程统一管理，确保环境一致，且可随时回滚。
设计角色层级需适度
- 角色层级（Role → Role）可以简化权限组合，但层级过深或互相交叉会带来维护难度。建议最多两层继承，并保持清晰的文档说明。
注意 MySQL 版本差异
- 只有 MySQL 8.0+ 支持原生角色功能；若仍使用 MySQL 5.7 及更低版本，可通过“用户组”模拟角色（需要额外维护中间表及触发器），但较为复杂且不推荐。

通过本文，你应已全面掌握 MySQL 角色权限管理的方方面面：从创建角色、授权、分配给用户，到设置默认角色、切换角色、撤销和删除角色，以及常见的应用场景与最佳实践。合理运用角色机制，可以大幅度简化权限管理流程、提高安全性，并为未来的业务扩展提供更灵活的权限架构。

- 阅读更多 -

MySQL游标与流程控制全解析：定义、使用及技巧‌

System

2025-06-07

所有,mysql,数据库

以下内容将从概念与语法入手，系统地讲解 MySQL 中游标（Cursor）与流程控制（Flow Control）的使用方法与技巧，并配以丰富的代码示例、ASCII 图解与详细说明，帮助你快速掌握在存储过程（Stored Procedure）或存储函数（Stored Function）中使用游标与流程控制的能力。建议边看边在 MySQL 沙箱环境中实践，加深理解。

1. 概述

在 MySQL 中，当我们需要对查询结果中的多行数据逐行遍历并进行复杂处理时，单纯的 SQL 语句往往无法满足需求。此时，就需要借助 游标（Cursor） 将结果集以“指针”的方式封装到存储程序中，配合 流程控制（Flow Control） 语句（如 LOOP、WHILE、IF、CASE、LEAVE、ITERATE 等）来实现逐行处理、条件分支、循环跳出等逻辑。

游标（Cursor）：类似于编程语言中的迭代器，用来保存一条或多条查询结果，通过 OPEN、FETCH、CLOSE 等操作让我们在存储过程里逐行取出数据。
流程控制（Flow Control）：MySQL 存储程序内置的一组语法，包括条件判断（IF…THEN…ELSE、CASE）、循环结构（LOOP、WHILE、REPEAT）与跳转控制（LEAVE、ITERATE 等），用来实现存储过程/函数中的分支与循环逻辑。

通过对二者的结合，我们可以在 MySQL 层面实现下面这些场景：

逐行读取查询结果并插入/更新/删除其他表（如统计、数据同步等）。
当查询到特定条件时跳出循环或跳到下一条，实现复杂的业务规则。
根据游标字段判断分支逻辑，如根据某列值进行分类处理。
处理分页数据，例如批量归档、拆分大表时逐页操作。

下面将循序渐进地介绍游标与流程控制的核心概念、语法、使用示例与最佳实践。

2. 游标基础

2.1 游标概念与生命周期

游标（Cursor） 本质上是一个指向查询结果集（Result Set）的指针。通过在存储程序中声明游标后，可以按以下步骤使用：
1. DECLARE CURSOR：声明游标，指定要执行的 SELECT 语句。
2. OPEN：打开游标，将查询结果集装载到内存中（或按需读取）。
3. FETCH：从游标返回一行（或一列）数据到变量。
4. REPEAT FETCH：重复 FETCH 直到游标到末尾。
5. CLOSE：关闭游标，释放资源。

生命周期示意图（ASCII）

+--------------------+
| 存储过程开始       |
|                    |
| 1. DECLARE 游标    |
| 2. OPEN 游标       |
|                    |
| ┌───────────┐      |
| │ 游标结果集 │      |
| └───────────┘      |
|    ↓ FETCH 1 行     |
|    ↓ FETCH 2 行     |
|       …             |
|    ↓ FETCH N 行     |
| 3. CLOSE 游标      |
|                    |
| 存储过程结束       |
+--------------------+

FETCH 直到条件变量 NOT FOUND，即没有更多行可取时跳出循环。

2.2 声明游标的基本语法

在 MySQL 存储程序（PROCEDURE 或 FUNCTION）中，游标的声明必须在所有变量（DECLARE var_name …）、条件处理器（DECLARE CONTINUE HANDLER …）之后，且在第一个可执行语句（如 SET、SELECT、INSERT 等）之前。

语法格式：

DECLARE cursor_name CURSOR FOR select_statement;

cursor_name：游标名称，自定义标识。
select_statement：任意合法的 SELECT 语句，用来生成游标结果集。

注意事项
声明位置：所有 DECLARE（包括变量、游标、条件处理器）必须出现在存储程序的最开始部分，且顺序为：
DECLARATION 部分：
DECLARE var1, var2, … ;
DECLARE done_flag INT DEFAULT 0;       -- 用作游标结束标志
DECLARE cur_name CURSOR FOR SELECT …;  -- 游标声明
DECLARE CONTINUE HANDLER FOR NOT FOUND SET done_flag = 1;  -- “无更多行”时处理
可执行语句部分：即在所有 DECLARE 后面才能写 OPEN cursor_name;、FETCH cursor_name INTO …; 等。
条件处理器（Handler）：
最常见的是 NOT FOUND 处理器，用于捕获 FETCH 到末尾时的错误标志。常用写法：
DECLARE CONTINUE HANDLER FOR NOT FOUND SET done_flag = 1;
当游标超出结果集时，MySQL 会触发 NOT FOUND 条件。如果我们不声明处理器，就会导致存储过程报错中断。
游标只能在存储过程/函数内使用，不能在普通 SQL 会话里直接使用 DECLARE CURSOR。

下面先演示一个简单存储过程，说明游标声明与基本用法。

3. 单游标示例：逐行读取并打印

假设有一张名为 employees 的表，结构如下：

CREATE TABLE employees (
  id        INT PRIMARY KEY AUTO_INCREMENT,
  name      VARCHAR(50),
  department VARCHAR(50),
  salary    DECIMAL(10,2)
);

INSERT INTO employees (name, department, salary) VALUES
('Alice',   'HR',      8000.00),
('Bob',     'Engineering', 12000.00),
('Cathy',   'Sales',    9500.00),
('David',   'Engineering', 11500.00),
('Eve',     'HR',      7800.00);

3.1 存储过程模板

我们要写一个存储过程，以游标方式逐行读取 employees 表的每行数据，打印到客户端（通过 SELECT 模拟“打印”），并在读取到特定条件时跳出循环。

DELIMITER //

CREATE PROCEDURE print_all_employees()
BEGIN
    -- 1. 变量声明
    DECLARE v_id INT;
    DECLARE v_name VARCHAR(50);
    DECLARE v_dept VARCHAR(50);
    DECLARE v_sal DECIMAL(10,2);

    DECLARE done_flag INT DEFAULT 0;  -- 标志是否到末尾

    -- 2. 游标声明：根据 employees 表查询需要读取的字段
    DECLARE emp_cursor CURSOR FOR
        SELECT id, name, department, salary
        FROM employees
        ORDER BY id;

    -- 3. 条件处理器：当游标读取到末尾时，将 done_flag 设为 1
    DECLARE CONTINUE HANDLER FOR NOT FOUND SET done_flag = 1;

    -- 4. 打开游标
    OPEN emp_cursor;

    -- 5. 循环读取
    read_loop: LOOP
        -- 5.1 取一行
        FETCH emp_cursor
        INTO v_id, v_name, v_dept, v_sal;

        -- 5.2 检查是否到末尾
        IF done_flag = 1 THEN
            LEAVE read_loop;  -- 跳出循环
        END IF;

        -- 5.3 在客户端打印读取到的值（用 SELECT 语句演示）
        SELECT
            CONCAT('ID=', v_id, ', Name=', v_name,
                   ', Dept=', v_dept, ', Salary=', v_sal) AS info;

        -- 5.4 如遇到特定条件可提前退出（例如 v_sal > 11000）
        IF v_sal > 11000 THEN
            SELECT CONCAT('High salary detected (', v_name, '), break.') AS alert_msg;
            LEAVE read_loop;
        END IF;

    END LOOP read_loop;

    -- 6. 关闭游标
    CLOSE emp_cursor;
END;
//

DELIMITER ;

3.1.1 关键点详解

变量声明（DECLARE v_id INT; 等）：用来接收 FETCH 出来的各列值。
done_flag 标志：常用来判断游标是否到末尾，当没有更多行时，MySQL 会触发 NOT FOUND 条件，执行对应的 CONTINUE HANDLER 设置 done_flag = 1。

游标声明：

DECLARE emp_cursor CURSOR FOR
    SELECT id, name, department, salary
    FROM employees
    ORDER BY id;

这里指定了要遍历的查询结果集，结果会按 id 升序返回。

条件处理器：
```
DECLARE CONTINUE HANDLER FOR NOT FOUND SET done_flag = 1;
```
- FOR NOT FOUND：表示若之后的 FETCH 没有可读取的行，则跳转到此处理器，将 done_flag 置为 1，并让程序继续执行（CONTINUE）。
打开游标：
```
OPEN emp_cursor;
```
这一步会执行 SELECT id, name, … 并将结果集保存到内部数据结构，等待调用 FETCH。
LOOP … END LOOP 循环：
- read_loop: LOOP：给循环一个标签 read_loop，以便后续使用 LEAVE read_loop 跳出循环。
- FETCH emp_cursor INTO v_id, v_name, v_dept, v_sal;：从游标取出一行数据，填充到四个变量中。
- 检查结束条件：IF done_flag = 1 THEN LEAVE read_loop; END IF;，如果已经到末尾则跳出循环。
- 业务逻辑处理：这里通过 SELECT CONCAT(...) AS info; 将信息“打印”到客户端（真实场景可改成 INSERT 或 UPDATE 等操作）。
- 提前跳出：演示了当 v_sal > 11000 时，再次 LEAVE read_loop，直接退出遍历。
关闭游标：CLOSE emp_cursor;，释放相应资源。

3.2 测试与执行

CALL print_all_employees();

3.2.1 执行结果示例

假设 employees 表如下：

+----+-------+-------------+---------+
| id | name  | department  | salary  |
+----+-------+-------------+---------+
|  1 | Alice | HR          |  8000.00|
|  2 | Bob   | Engineering | 12000.00|
|  3 | Cathy | Sales       |  9500.00|
|  4 | David | Engineering | 11500.00|
|  5 | Eve   | HR          |  7800.00|
+----+-------+-------------+---------+

执行 CALL print_all_employees(); 之后，会依次输出：

+----------------------------------------------+
| info                                         |
+----------------------------------------------+
| ID=1, Name=Alice, Dept=HR, Salary=8000.00    |
+----------------------------------------------+

+----------------------------------------------+
| info                                         |
+----------------------------------------------+
| ID=2, Name=Bob, Dept=Engineering, Salary=12000.00|
+----------------------------------------------+

+----------------------------------------------+
| High salary detected (Bob), break.           |
+----------------------------------------------+

当读取到第二行（Bob, salary=12000）时，符合 v_sal > 11000 条件，触发提前跳出的逻辑，因此后续记录（Cathy 等）不再处理。

4. 进一步演示：在游标中执行 DML 操作

上节示例只演示了“读取并打印”。实际业务场景往往需要在读取一行后进行修改/插入/删除等操作。例如：对 employees 表中所有 Engineering 部门员工的薪水进行一次调整，并将操作记录到日志表 salary_changes。

4.1 表结构准备

-- 原employees表（与上节相同，假定已存在）
-- 额外创建日志表
CREATE TABLE salary_changes (
  change_id INT PRIMARY KEY AUTO_INCREMENT,
  emp_id     INT,
  old_salary DECIMAL(10,2),
  new_salary DECIMAL(10,2),
  changed_at DATETIME DEFAULT CURRENT_TIMESTAMP
);

4.2 存储过程：遍历并更新

DELIMITER //

CREATE PROCEDURE increase_engineering_salaries()
BEGIN
    -- 1. 变量声明
    DECLARE v_id INT;
    DECLARE v_name VARCHAR(50);
    DECLARE v_dept VARCHAR(50);
    DECLARE v_sal DECIMAL(10,2);

    DECLARE done_flag INT DEFAULT 0;  -- 游标结束标志

    -- 2. 声明游标：选出 Engineering 部门所有员工
    DECLARE eng_cursor CURSOR FOR
        SELECT id, name, department, salary
        FROM employees
        WHERE department = 'Engineering'
        ORDER BY id;

    -- 3. NOT FOUND 处理器
    DECLARE CONTINUE HANDLER FOR NOT FOUND SET done_flag = 1;

    -- 4. 打开游标
    OPEN eng_cursor;

    -- 5. 循环读取
    fetch_loop: LOOP
        FETCH eng_cursor INTO v_id, v_name, v_dept, v_sal;

        IF done_flag = 1 THEN
            LEAVE fetch_loop;
        END IF;

        -- 5.1 计算新薪水：涨 10%
        SET @new_salary = v_sal * 1.10;

        -- 5.2 更新 employees 表
        UPDATE employees
        SET salary = @new_salary
        WHERE id = v_id;

        -- 5.3 插入日志表
        INSERT INTO salary_changes (emp_id, old_salary, new_salary)
        VALUES (v_id, v_sal, @new_salary);

    END LOOP fetch_loop;

    -- 6. 关闭游标
    CLOSE eng_cursor;
END;
//

DELIMITER ;

4.2.1 说明与要点

DECLARE eng_cursor CURSOR FOR SELECT … WHERE department = 'Engineering'：
- 只遍历 Engineering 部门的员工。
- 有 ORDER BY id 保证处理顺序一致。
更新与日志：
- 在 FETCH 拿到 v_id、v_sal 后，用 UPDATE employees … 修改薪水，再用 INSERT INTO salary_changes … 写入操作日志。
- 注意这里使用了用户变量 @new_salary，也可以直接用局部变量 DECLARE v_new_sal DECIMAL(10,2); SET v_new_sal = v_sal * 1.10;。
事务与并发：
- 如果同时有其他会话在操作 employees 表，需根据业务需要显式开启事务（START TRANSACTION; … COMMIT;）并考虑隔离级别。
- 本示例未显示使用事务，但实际场景下，最好将更新与日志插入放在同一个事务中，确保一致性。

4.3 执行示例

-- 假设初始employees:
+----+-------+-------------+---------+
| id | name  | department  | salary  |
+----+-------+-------------+---------+
|  2 | Bob   | Engineering | 12000.00|
|  4 | David | Engineering | 11500.00|
+----+-------+-------------+---------+

CALL increase_engineering_salaries();

-- 执行后，employees表:
+----+-------+-------------+---------+
| id | name  | department  | salary  |
+----+-------+-------------+---------+
|  2 | Bob   | Engineering | 13200.00|  -- 12000 * 1.1
|  4 | David | Engineering | 12650.00|  -- 11500 * 1.1
+----+-------+-------------+---------+

-- salary_changes 日志:
+-----------+--------+------------+------------+---------------------+
| change_id | emp_id | old_salary | new_salary |    changed_at       |
+-----------+--------+------------+------------+---------------------+
|     1     |   2    |  12000.00  | 13200.00   | 2025-06-07 17:10:05 |
|     2     |   4    |  11500.00  | 12650.00   | 2025-06-07 17:10:05 |
+-----------+--------+------------+------------+---------------------+

5. 多游标与嵌套游标

在某些场景，需要对多个结果集分别遍历，并且游标之间可能有关联；这时就要用到 多游标 或 嵌套游标。以下示例演示：先遍历部门表，再针对每个部门遍历该部门下的员工。

5.1 表结构示例

CREATE TABLE departments (
  dept_id   INT PRIMARY KEY AUTO_INCREMENT,
  dept_name VARCHAR(50)
);

CREATE TABLE employees (
  id         INT PRIMARY KEY AUTO_INCREMENT,
  name       VARCHAR(50),
  dept_id    INT,
  salary     DECIMAL(10,2),
  FOREIGN KEY (dept_id) REFERENCES departments(dept_id)
);

INSERT INTO departments (dept_name) VALUES
('HR'), ('Engineering'), ('Sales');

INSERT INTO employees (name, dept_id, salary) VALUES
('Alice',   1,  8000.00),
('Eve',     1,  7800.00),
('Bob',     2, 12000.00),
('David',   2, 11500.00),
('Cathy',   3,  9500.00);

5.2 需求

遍历每个部门（departments 表），打印部门名称。
对当前部门，再遍历该部门下的员工（employees 表），打印员工信息。
结束后继续下一个部门。

5.3 存储过程示例：嵌套游标

DELIMITER //

CREATE PROCEDURE print_dept_emp()
BEGIN
    -- 1. 声明部门游标相关变量
    DECLARE v_dept_id INT;
    DECLARE v_dept_name VARCHAR(50);

    DECLARE dept_done INT DEFAULT 0;

    -- 2. 声明员工游标相关变量
    DECLARE v_emp_id INT;
    DECLARE v_emp_name VARCHAR(50);
    DECLARE v_emp_sal DECIMAL(10,2);

    DECLARE emp_done INT DEFAULT 0;

    -- 3. 声明部门游标
    DECLARE dept_cursor CURSOR FOR
        SELECT dept_id, dept_name
        FROM departments
        ORDER BY dept_id;

    DECLARE CONTINUE HANDLER FOR NOT FOUND SET dept_done = 1;

    -- 4. 打开部门游标
    OPEN dept_cursor;

    -- 5. 遍历部门
    dept_loop: LOOP
        FETCH dept_cursor INTO v_dept_id, v_dept_name;
        IF dept_done = 1 THEN
            LEAVE dept_loop;
        END IF;

        -- 打印部门信息
        SELECT CONCAT('Department: [', v_dept_id, '] ', v_dept_name) AS dept_info;

        -- 在当前部门下声明并打开员工游标
        -- 5.1 每次进入新部门前先重置 emp_done 标志
        SET emp_done = 0;

        -- 5.2 命名空间中要先 DECLARE 处理器，再 DECLARE 游标
        --     所以要用一个子块（BEGIN…END）来隔离 emp_cursor
        BEGIN
            -- 声明员工游标的处理器（针对员工游标读取结束）
            DECLARE CONTINUE HANDLER FOR NOT FOUND SET emp_done = 1;

            -- 声明员工游标：只遍历当前部门的员工
            DECLARE emp_cursor CURSOR FOR
                SELECT id, name, salary
                FROM employees
                WHERE dept_id = v_dept_id
                ORDER BY id;

            -- 打开员工游标
            OPEN emp_cursor;

            -- 遍历员工
            emp_loop: LOOP
                FETCH emp_cursor INTO v_emp_id, v_emp_name, v_emp_sal;
                IF emp_done = 1 THEN
                    LEAVE emp_loop;
                END IF;

                -- 打印员工信息
                SELECT CONCAT('  -> EmpID=', v_emp_id,
                              ', Name=', v_emp_name,
                              ', Salary=', v_emp_sal) AS emp_info;
            END LOOP emp_loop;

            -- 关闭员工游标
            CLOSE emp_cursor;
        END;

        -- 继续下一个部门
    END LOOP dept_loop;

    -- 6. 关闭部门游标
    CLOSE dept_cursor;
END;
//

DELIMITER ;

5.3.1 关键点与注意事项

嵌套声明位置
- 因为 MySQL 要求 DECLARE … HANDLER 与 DECLARE … CURSOR 必须在存储程序局部“最前面”，在一个存储过程体内，如果想为第二个游标声明处理器和游标，就需要用一个新的块（BEGIN … END）隔离。
- 外层的 dept_cursor 处于最外层块，内层的 emp_cursor 则放在一个新的匿名块（BEGIN … END）中。
处理器隔离
- 外层使用 dept_done，内层使用 emp_done，互不干扰。
- 如果不使用匿名子块，内层的 DECLARE CONTINUE HANDLER FOR NOT FOUND 会与外层冲突，导致逻辑混乱。
CURSOR 作用域
- emp_cursor 只在内层匿名块中有效，出了该块就会失效。每次循环进入一个新部门时，都会重新进入该匿名块，重新声明处理器和游标。

流程示意（ASCII）

+---------------------------------------+
| OPEN dept_cursor                      |
| LOOP dept_loop:                       |
|   FETCH dept_cursor INTO v_dept_*      |
|   IF dept_done=1 THEN LEAVE dept_loop  |
|   PRINT 部门信息                       |
|                                       |
|   BEGIN (匿名块，为 emp_cursor 做声明) |
|     SET emp_done = 0                  |
|     DECLARE emp_cursor CURSOR FOR ... |
|     DECLARE handler FOR NOT FOUND ... |
|     OPEN emp_cursor                   |
|     LOOP emp_loop:                    |
|       FETCH emp_cursor INTO v_emp_*   |
|       IF emp_done=1 THEN LEAVE emp_loop|
|       PRINT 员工信息                   |
|     END LOOP emp_loop                 |
|     CLOSE emp_cursor                  |
|   END (匿名块结束)                    |
|                                       |
| END LOOP dept_loop                    |
| CLOSE dept_cursor                     |
+---------------------------------------+

5.4 执行与结果示例

CALL print_dept_emp();

假设 departments 和 employees 表如前所示，执行结果类似：

+----------------------------------------+
| dept_info                              |
+----------------------------------------+
| Department: [1] HR                     |
+----------------------------------------+

+------------------------------+
| emp_info                     |
+------------------------------+
|   -> EmpID=1, Name=Alice, Salary=8000.00 |
+------------------------------+
|   -> EmpID=5, Name=Eve,   Salary=7800.00 |
+------------------------------+

+----------------------------------------+
| dept_info                              |
+----------------------------------------+
| Department: [2] Engineering            |
+----------------------------------------+

+------------------------------+
| emp_info                     |
+------------------------------+
|   -> EmpID=2, Name=Bob,     Salary=12000.00 |
+------------------------------+
|   -> EmpID=4, Name=David,   Salary=11500.00 |
+------------------------------+

+----------------------------------------+
| dept_info                              |
+----------------------------------------+
| Department: [3] Sales                  |
+----------------------------------------+

+------------------------------+
| emp_info                     |
+------------------------------+
|   -> EmpID=3, Name=Cathy,   Salary=9500.00 |
+------------------------------+

6. 流程控制详解

在前面的示例中，我们已经用到了 LOOP … END LOOP、IF … THEN … END IF、LEAVE 等流程控制语句。下面集中介绍 MySQL 存储程序中所有常见的流程控制要素，并以示例加以说明。

6.1 条件判断

6.1.1 IF…THEN…ELSEIF…ELSE…END IF

语法：

IF condition1 THEN
  statements1;
[ELSEIF condition2 THEN
  statements2;]
[ELSE
  statements3;]
END IF;

示例：根据员工薪资等级打印不同信息。

DELIMITER //

CREATE PROCEDURE salary_grade_check()
BEGIN
    DECLARE v_id INT;
    DECLARE v_name VARCHAR(50);
    DECLARE v_sal DECIMAL(10,2);

    DECLARE done_flag INT DEFAULT 0;
    DECLARE emp_cur CURSOR FOR
        SELECT id, name, salary FROM employees;
    DECLARE CONTINUE HANDLER FOR NOT FOUND SET done_flag = 1;

    OPEN emp_cur;

    read_loop: LOOP
        FETCH emp_cur INTO v_id, v_name, v_sal;
        IF done_flag = 1 THEN
            LEAVE read_loop;
        END IF;

        IF v_sal >= 11000 THEN
            SELECT CONCAT(v_name, ' is high earner.') AS msg;
        ELSEIF v_sal BETWEEN 9000 AND 10999.99 THEN
            SELECT CONCAT(v_name, ' is mid-level earner.') AS msg;
        ELSE
            SELECT CONCAT(v_name, ' is low earner.') AS msg;
        END IF;

    END LOOP read_loop;

    CLOSE emp_cur;
END;
//

DELIMITER ;

根据 v_sal 的范围，分别用不同分支打印提示。

6.1.2 CASE…WHEN…THEN…ELSE…END CASE

语法：

CASE
  WHEN condition1 THEN result1
  WHEN condition2 THEN result2
  ...
  ELSE resultN
END CASE;

示例：使用 CASE 将部门 ID 转为部门名称（假设在某些场合不想联表）。

SELECT id, name,
       CASE department
           WHEN 'HR'          THEN 'Human Resources'
           WHEN 'Engineering' THEN 'Engineering Dept'
           WHEN 'Sales'       THEN 'Sales Dept'
           ELSE 'Unknown'
       END AS dept_full_name
FROM employees;

在存储过程里赋值示例：

DELIMITER //

CREATE PROCEDURE set_dept_code()
BEGIN
    DECLARE v_id INT;
    DECLARE v_dept VARCHAR(50);
    DECLARE v_code INT;

    DECLARE done_flag INT DEFAULT 0;
    DECLARE emp_cur CURSOR FOR
        SELECT id, department FROM employees;
    DECLARE CONTINUE HANDLER FOR NOT FOUND SET done_flag = 1;

    OPEN emp_cur;

    label_loop: LOOP
        FETCH emp_cur INTO v_id, v_dept;
        IF done_flag = 1 THEN
            LEAVE label_loop;
        END IF;

        SET v_code = CASE
            WHEN v_dept = 'HR' THEN 10
            WHEN v_dept = 'Engineering' THEN 20
            WHEN v_dept = 'Sales' THEN 30
            ELSE 0
        END;

        -- 更新到表里，假设新增了一列 dept_code
        UPDATE employees
        SET department = CONCAT(v_dept, '(', v_code, ')')
        WHERE id = v_id;
    END LOOP label_loop;

    CLOSE emp_cur;
END;
//

DELIMITER ;

CASE 结构等价于多个 IF...ELSEIF，在对单个字段赋值时更简洁。

6.2 循环结构

MySQL 中常见的循环结构有三种：LOOP、WHILE、REPEAT。它们的差异与用法如下。

6.2.1 LOOP…END LOOP

语法：

[label:] LOOP
    statements;
    [LEAVE label;]
    [ITERATE label;]
    ...
END LOOP [label];

需要配合标签 label 和 LEAVE、ITERATE 跳出或继续循环。

示例：下面例子在循环里 ITERATE 用于跳到下一次循环，LEAVE 用于跳出整个循环。

DELIMITER //

CREATE PROCEDURE loop_example()
BEGIN
    DECLARE i INT DEFAULT 0;
    DECLARE max_i INT DEFAULT 10;

    loop_label: LOOP
        SET i = i + 1;

        IF i = 3 THEN
            -- 跳过当前循环（即不执行后续打印），直接进入下次循环
            ITERATE loop_label;
        END IF;

        IF i = 8 THEN
            -- 提前跳出循环
            LEAVE loop_label;
        END IF;

        SELECT CONCAT('Loop iteration: ', i) AS iter_msg;
    END LOOP loop_label;
END;
//

DELIMITER ;

-- 调用
CALL loop_example();

该存储过程会依次打印 1、2（跳过 3）、4、5、6、7，然后在 i=8 时 LEAVE，循环结束。

6.2.2 WHILE…DO…END WHILE

语法：

[label:] WHILE search_condition DO
    statements;
    [ITERATE label;]
    [LEAVE label;]
    ...
END WHILE [label];

在进入循环体前会先判断 search_condition，满足条件才执行循环体；不满足时直接跳出。

示例：计算 1 到 5 的累加和。

DELIMITER //

CREATE PROCEDURE while_sum()
BEGIN
    DECLARE i INT DEFAULT 1;
    DECLARE total INT DEFAULT 0;

    WHILE i <= 5 DO
        SET total = total + i;
        SET i = i + 1;
    END WHILE;

    SELECT CONCAT('Sum 1 to 5 = ', total) AS result;
END;
//

DELIMITER ;

6.2.3 REPEAT…UNTIL…END REPEAT

语法：

[label:] REPEAT
    statements;
    [ITERATE label;]
    [LEAVE label;]
    ...
UNTIL search_condition
END REPEAT [label];

会先执行一次循环体，然后再判断 search_condition，如果满足条件则退出，否则继续执行。

示例：与上一示例等价，但使用 REPEAT。

DELIMITER //

CREATE PROCEDURE repeat_sum()
BEGIN
    DECLARE i INT DEFAULT 1;
    DECLARE total INT DEFAULT 0;

    repeat_label: REPEAT
        SET total = total + i;
        SET i = i + 1;
    UNTIL i > 5
    END REPEAT;

    SELECT CONCAT('Sum 1 to 5 = ', total) AS result;
END;
//

DELIMITER ;

6.3 跳转控制：LEAVE 与 ITERATE

LEAVE label：立即跳出标记为 label 的循环体，继续执行循环体外的第一个语句。
ITERATE label：立即跳到标记为 label 的循环的下一次迭代，相当于 continue。

label1: LOOP
    …
    IF cond1 THEN
        ITERATE label1; -- 跳过当前循环，进入下一次迭代
    END IF;

    IF cond2 THEN
        LEAVE label1;   -- 跳出循环体，执行 label1 之后的语句
    END IF;
END LOOP label1;

7. 游标与流程控制综合示例

下面通过一个综合实例，将游标、IF、LOOP、WHILE、LEAVE、ITERATE 等多种流程控制技术结合，完成一个稍微复杂的任务：统计每个部门的全体员工薪水，并将结果写入一张统计表 dept_salary_totals 中。对于薪资总额超过一定阈值（如 > 20000）的部门，需要额外插入告警记录到表 dept_alerts。

7.1 表结构准备

-- 原 employees 表（同上），字段: id, name, dept_id, salary

-- 部门表
CREATE TABLE departments (
  dept_id   INT PRIMARY KEY AUTO_INCREMENT,
  dept_name VARCHAR(50)
);

-- 部门薪资合计表
CREATE TABLE dept_salary_totals (
  dept_id       INT PRIMARY KEY,
  total_salary  DECIMAL(15,2),
  calculated_at DATETIME DEFAULT CURRENT_TIMESTAMP,
  FOREIGN KEY (dept_id) REFERENCES departments(dept_id)
);

-- 警告表：当总薪资超过阈值时，记录一条告警
CREATE TABLE dept_alerts (
  alert_id    INT PRIMARY KEY AUTO_INCREMENT,
  dept_id     INT,
  total_salary DECIMAL(15,2),
  alert_time  DATETIME DEFAULT CURRENT_TIMESTAMP,
  FOREIGN KEY (dept_id) REFERENCES departments(dept_id)
);

7.2 存储过程：逐部门统计并写入

DELIMITER //

CREATE PROCEDURE calculate_dept_salaries()
BEGIN
    -- 1. 变量声明
    DECLARE v_dept_id INT;
    DECLARE v_dept_name VARCHAR(50);

    DECLARE v_emp_id INT;
    DECLARE v_emp_sal DECIMAL(10,2);

    DECLARE dept_total DECIMAL(15,2);

    DECLARE dept_done INT DEFAULT 0;
    DECLARE emp_done INT DEFAULT 0;

    -- 薪资阈值
    DECLARE salary_threshold DECIMAL(15,2) DEFAULT 20000.00;

    -- 2. 部门游标：遍历所有部门
    DECLARE dept_cursor CURSOR FOR
        SELECT dept_id, dept_name FROM departments;
    DECLARE CONTINUE HANDLER FOR NOT FOUND SET dept_done = 1;

    -- 3. 打开部门游标
    OPEN dept_cursor;

    dept_loop: LOOP
        -- 3.1 取下一部门
        FETCH dept_cursor INTO v_dept_id, v_dept_name;
        IF dept_done = 1 THEN
            LEAVE dept_loop;
        END IF;

        -- 3.2 初始化部门薪资汇总
        SET dept_total = 0;
        SET emp_done = 0;

        -- 3.3 员工游标：遍历当前部门所有员工
        BEGIN
            DECLARE CONTINUE HANDLER FOR NOT FOUND SET emp_done = 1;
            DECLARE emp_cursor CURSOR FOR
                SELECT id, salary
                FROM employees
                WHERE dept_id = v_dept_id;

            OPEN emp_cursor;

            emp_loop: LOOP
                FETCH emp_cursor INTO v_emp_id, v_emp_sal;
                IF emp_done = 1 THEN
                    LEAVE emp_loop;
                END IF;

                -- 累加薪资
                SET dept_total = dept_total + v_emp_sal;
            END LOOP emp_loop;

            CLOSE emp_cursor;
        END;

        -- 3.4 插入或更新 dept_salary_totals 表
        -- 如果已有记录，则更新；否则插入。
        IF EXISTS (SELECT 1 FROM dept_salary_totals WHERE dept_id = v_dept_id) THEN
            UPDATE dept_salary_totals
            SET total_salary = dept_total,
                calculated_at = NOW()
            WHERE dept_id = v_dept_id;
        ELSE
            INSERT INTO dept_salary_totals (dept_id, total_salary)
            VALUES (v_dept_id, dept_total);
        END IF;

        -- 3.5 如果薪资总额超过阈值，插入告警表
        IF dept_total > salary_threshold THEN
            INSERT INTO dept_alerts (dept_id, total_salary)
            VALUES (v_dept_id, dept_total);
        END IF;

    END LOOP dept_loop;

    -- 4. 关闭部门游标
    CLOSE dept_cursor;
END;
//

DELIMITER ;

7.2.1 解析与要点

两个游标的块级隔离
- 部门游标在最外层声明并打开。
- 针对每个部门，使用一个匿名块 BEGIN … END; 来声明与使用员工游标，确保 DECLARE 顺序与作用域正确。
dept_total 累加
- 在进入员工游标前，将 dept_total 置为 0。
- 每次 FETCH 得到 v_emp_sal 后，用 dept_total = dept_total + v_emp_sal 进行累加。
INSERT … ON DUPLICATE KEY UPDATE（可选优化）
- 上例中用 IF EXISTS … UPDATE … ELSE INSERT 判断表中是否已有记录。
- 也可以直接用：
```
INSERT INTO dept_salary_totals (dept_id, total_salary)
VALUES (v_dept_id, dept_total)
ON DUPLICATE KEY UPDATE
  total_salary = dept_total,
  calculated_at = NOW();
```
  这样写更简洁。
阈值告警
- 当 dept_total 超过 salary_threshold 时，插入 dept_alerts。
- 如果想避免重复插入同一部门多条告警，可在插入前先判断或使用唯一索引。

控制流程示意（ASCII）

+-------------------------------------------+
| OPEN dept_cursor                          |
| dept_loop: LOOP                           |
|   FETCH dept_cursor INTO v_dept_*          |
|   IF dept_done=1 THEN LEAVE dept_loop     |
|                                           |
|   SET dept_total = 0                      |
|   emp_done = 0                            |
|                                           |
|   BEGIN (匿名块，用于员工游标)             |
|     DECLARE emp_cursor FOR SELECT id,sal… |
|     DECLARE handler FOR NOT FOUND          |
|     OPEN emp_cursor                       |
|     emp_loop: LOOP                        |
|       FETCH emp_cursor INTO v_emp_*       |
|       IF emp_done=1 THEN LEAVE emp_loop   |
|       SET dept_total = dept_total + v_emp_sal |
|     END LOOP emp_loop                     |
|     CLOSE emp_cursor                      |
|   END                                      |
|                                           |
|   插入/更新 dept_salary_totals            |
|   IF dept_total > threshold THEN          |
|     INSERT INTO dept_alerts               |
|   END IF                                  |
|                                           |
| END LOOP dept_loop                        |
| CLOSE dept_cursor                         |
+-------------------------------------------+

8. 完整示例演练：分页处理大表

当表数据量非常大时，直接用游标一次性遍历会导致长时间锁表、占用资源。此时可以结合分页和游标的思路：先按 主键范围 或 LIMIT/OFFSET 分页，每页使用游标或直接 SELECT … INTO 批量处理，然后循环下一页，直到处理完所有数据。下面示例演示如何分批统计 employees 表的薪资总和，避免一次性加载整个表。

8.1 思路概要

假设 employees 表主键为 id。
每次从 last_id+1 开始，取出 batch_size 条记录（如 1000 条）。
对当前批次执行统计（或其它处理）。
更新 last_id 为本批次的最大 id，重复步骤 2，直到没有更多记录。

8.2 存储过程示例

DELIMITER //

CREATE PROCEDURE batch_process_employees(batch_size INT)
BEGIN
    DECLARE v_last_id INT DEFAULT 0;
    DECLARE v_max_id INT;
    DECLARE v_batch_total DECIMAL(15,2);

    DECLARE rows_affected INT DEFAULT 1;

    -- 1. 获取 employees 表最大 id
    SELECT MAX(id) INTO v_max_id FROM employees;

    -- 2. 如果表为空，直接返回
    IF v_max_id IS NULL THEN
        SELECT 'Table is empty.' AS msg;
        LEAVE proc_end;
    END IF;

    -- 3. 分页循环：当 v_last_id < v_max_id 时继续
    WHILE v_last_id < v_max_id DO
        -- 使用子查询统计 id 在 (v_last_id, v_last_id+batch_size] 范围内的薪资总和
        SELECT SUM(salary) INTO v_batch_total
        FROM employees
        WHERE id > v_last_id
          AND id <= v_last_id + batch_size;

        -- 输出本批次统计结果
        SELECT CONCAT('Processed IDs (', v_last_id+1, ' to ', LEAST(v_last_id+batch_size, v_max_id),
                      '), Batch Salary Sum=', IFNULL(v_batch_total,0)) AS batch_info;

        -- 更新 last_id
        SET v_last_id = v_last_id + batch_size;
    END WHILE;

    proc_end: BEGIN END;
END;
//

DELIMITER ;

8.2.1 说明

batch_size 参数：由调用者指定每页大小。
v_last_id 和 v_max_id：
- v_last_id 用于记录上一批次的最大 id，初始为 0。
- v_max_id = 表中最大 id，用于确定循环终止条件。
WHILE v_last_id < v_max_id DO … END WHILE：
- 当 v_last_id 小于 v_max_id 时继续。
- 每次统计 id 在 (v_last_id, v_last_id + batch_size] 范围中的数据。
- LEAST(v_last_id+batch_size, v_max_id) 用来避免最后一页超过最大值。
子查询 SUM(salary)：一次性统计当前批次薪资和，无需显式游标遍历。
分页操作：若需要针对每条记录做更复杂操作，可以在子查询改为 DECLARE cursor FOR SELECT id, name, salary … LIMIT … OFFSET …，再用游标逐条处理。

8.3 调用示例

CALL batch_process_employees(2);

假设 employees 表如下：

+----+-------+-------------+---------+
| id | name  | department  | salary  |
+----+-------+-------------+---------+
|  1 | Alice | HR          |  8000.00|
|  2 | Eve   | HR          |  7800.00|
|  3 | Bob   | Engineering | 12000.00|
|  4 | David | Engineering | 11500.00|
|  5 | Cathy | Sales       |  9500.00|
+----+-------+-------------+---------+

执行结果：

+--------------------------------------------------+
| batch_info                                       |
+--------------------------------------------------+
| Processed IDs (1 to 2), Batch Salary Sum=15800.00|
+--------------------------------------------------+

+--------------------------------------------------+
| batch_info                                       |
+--------------------------------------------------+
| Processed IDs (3 to 4), Batch Salary Sum=23500.00|
+--------------------------------------------------+

+--------------------------------------------------+
| batch_info                                       |
+--------------------------------------------------+
| Processed IDs (5 to 5), Batch Salary Sum=9500.00 |
+--------------------------------------------------+

由于 batch_size=2，共分三页：
1. IDs 1–2，总和 = 8000 + 7800 = 15800
2. IDs 3–4，总和 = 12000 + 11500 = 23500
3. IDs 5–5，总和 = 9500

9. 错误处理与注意事项

在编写带游标与流程控制的存储程序时，需要注意以下要点以保证正确性和性能。

9.1 条件处理器（Handler）与异常捕获

CONTINUE HANDLER FOR NOT FOUND：
- 必须与相应游标配合使用，检测 FETCH 到末尾时触发，将标志变量置为 1，让程序通过判断跳出循环。
- 如果不声明该处理器，FETCH 到末尾会导致存储过程报错并中止。

其他常见处理器：

DECLARE EXIT HANDLER FOR SQLEXCEPTION
   BEGIN
      -- 遇到任何 SQL 错误（如除 0、类型转换错误等）都会执行这里
      ROLLBACK;
      SELECT 'An SQL error occurred' AS err_msg;
   END;

EXIT HANDLER：触发后退出整个存储程序块，不会继续。
CONTINUE HANDLER：触发后仅执行处理体，然后继续后续代码。

9.2 游标性能与资源

游标会占用服务器资源，尤其是针对大结果集时，可能会一次性将整个结果载入内存。
对于超大表，最好结合分页或 LIMIT OFFSET，每次处理一小批数据，避免一次性打开一个巨大的游标。
在一个存储程序中同时打开过多游标会导致资源紧张，应合理控制并且及时 CLOSE。

9.3 避免死循环

在 LOOP、WHILE、REPEAT 中，一定要保证循环的终止条件能够被正确触发，否则会导致死循环。
对于游标循环，务必在 FETCH 后检查 done_flag，并在适当位置调用 LEAVE。

9.4 变量作用域

MySQL 存储过程中的 DECLARE 只能在最开始位置声明，且不能在任意行位置。因此，如果要在同一存储过程或函数里使用多套游标与处理器，务必使用嵌套的匿名块（BEGIN … END）来隔离，避免变量/处理器/游标命名冲突或顺序错误。

9.5 事务与并发问题

如果存储程序中涉及多次 UPDATE、INSERT，建议显式开启事务（START TRANSACTION）并在结束时手动 COMMIT 或 ROLLBACK。
在循环体中进行大量 DML 操作时，要关注锁的粒度与隔离级别；防止长事务导致死锁或阻塞。

10. 总结与技巧汇总

通过本文，你已经系统地学习了 MySQL 存储程序中游标与流程控制的使用方法与技巧，包括：

游标基础
- DECLARE CURSOR FOR SELECT …
- OPEN、FETCH INTO、CLOSE
- CONTINUE HANDLER FOR NOT FOUND 捕获游标末尾
流程控制
- 条件：IF … THEN … ELSEIF … ELSE … END IF，CASE … WHEN … END CASE
- 循环：LOOP … END LOOP（配合 LEAVE、ITERATE），WHILE … END WHILE，REPEAT … UNTIL … END REPEAT
- 跳转：LEAVE label、ITERATE label，可实现“跳出循环”、“进入下一次迭代”等
多游标 / 嵌套游标
- 使用匿名块（BEGIN…END）隔离不同层级的游标与处理器声明，避免命名与作用域冲突。
- 先外部声明一层游标，内部再嵌套声明第二层游标，实现“先遍历部门，再遍历员工”等需求。
综合业务示例
- 逐行打印：读取 employees 表行并打印。
- 批量更新：遍历并更新 Engineering 部门员工薪水，同时写日志。
- 部门统计：遍历部门游标，再嵌套遍历员工游标，累计薪水并写入统计表和告警表。
- 分页处理：结合主键范围做批量统计，避免一次性加载全表。
常见注意事项
- 游标会占用资源，谨慎使用大结果集。
- 始终使用 CONTINUE HANDLER FOR NOT FOUND 处理 FETCH 到末尾的情况，避免报错中断。
- 确保循环逻辑有可触发的终止条件，避免死循环。
- 在一个存储程序中使用多套游标时，务必用块级匿名 BEGIN…END 隔离作用域。
- 对于涉及多次 DML 的复杂逻辑，可显式开启事务（START TRANSACTION/COMMIT）保证数据一致性。

掌握了上述内容后，你就能在 MySQL 存储程序层面灵活地对多行结果集进行逐行处理，并结合多种流程控制语法实现复杂业务逻辑。接下来，建议动手将本文举例在你自己的数据库环境中运行、调试，并根据实际需求进行改造与优化，逐步积累经验。

- 阅读更多 -

MySQL高级联结技巧：让你轻松掌握创建方法‌

System

2025-06-07

所有,mysql,数据库

以下内容将从概念出发，结合丰富的代码示例、图解与实操要点，帮助你深入理解并掌握 MySQL 中各种高级联结（JOIN）技巧。阅读过程中建议结合演练，以便更好地理解数据是如何“联结”在一起的。

1. 概述

联结（JOIN）：数据库中最常用的操作之一，用来将两个或多个表中的相关数据“按行”关联在一起查询。
随着数据模型变复杂，单纯的简单 INNER JOIN 已无法满足需求。本篇围绕 MySQL 的各种高级联结技巧展开，包括：
1. 多表联结与复杂条件
2. 自联结（Self-Join）
3. 派生表（Derived Tables）与临时表结合联结
4. LATERAL（横向联结）与 JSON\_TABLE（MySQL 8.0+）
5. 联结优化策略：索引、执行计划与避免笛卡尔积

本文示例基于 MySQL 8.0，但绝大多数技巧也适用于 5.7 及更早版本。示例中的表结构与数据可根据自身业务进行调整。

2. 基础联结回顾（快速复习）

在进入高级技巧之前，先快速回顾四种最常见的联结类型（本节仅作背景铺垫，若已熟悉可跳过）。

2.1 INNER JOIN（内联结）

只返回在两个表中 匹配联结条件 的行。

语法：

SELECT a.*, b.*
FROM table_a AS a
INNER JOIN table_b AS b
  ON a.key = b.key;

示例表

CREATE TABLE users (
  id INT PRIMARY KEY,
  name VARCHAR(20)
);

CREATE TABLE orders (
  id INT PRIMARY KEY,
  user_id INT,
  amount DECIMAL(10,2)
);

INSERT INTO users VALUES
(1, 'Alice'),
(2, 'Bob'),
(3, 'Cathy');

INSERT INTO orders VALUES
(100, 1, 59.90),
(101, 1, 120.00),
(102, 3, 9.99);

INNER JOIN 查询

SELECT u.id AS user_id, u.name, o.id AS order_id, o.amount
FROM users AS u
INNER JOIN orders AS o
  ON u.id = o.user_id;

图解（INNER JOIN 匹配示意）

 users           orders
+------+-------+   +----+---------+--------+
| id   | name  |   | id | user_id | amount |
+------+-------+   +----+---------+--------+
|  1   | Alice |   |100 |   1     | 59.90  |
|  2   | Bob   |   |101 |   1     |120.00  |
|  3   | Cathy |   |102 |   3     |  9.99  |
+------+-------+   +----+---------+--------+

 内联结条件： u.id = o.user_id

 匹配结果：
  - u=1 ↔ o=100、o=101
  - u=3 ↔ o=102
  (u=2 无匹配记录被排除)

结果集：

+---------+-------+----------+--------+
| user_id | name  | order_id | amount |
+---------+-------+----------+--------+
|    1    | Alice |   100    |  59.90 |
|    1    | Alice |   101    | 120.00 |
|    3    | Cathy |   102    |   9.99 |
+---------+-------+----------+--------+

2.2 LEFT JOIN（左联结）

返回左表中所有行，以及右表中匹配的行；如果右表无匹配，则对应列返回 NULL。

语法：

SELECT a.*, b.*
FROM table_a AS a
LEFT JOIN table_b AS b
  ON a.key = b.key;

LEFT JOIN 示例

SELECT u.id AS user_id, u.name, o.id AS order_id, o.amount
FROM users AS u
LEFT JOIN orders AS o
  ON u.id = o.user_id;

图解（LEFT JOIN 匹配示意）

 左表 users        右表 orders
+------+-------+   +----+---------+--------+
| id   | name  |   | id | user_id | amount |
+------+-------+   +----+---------+--------+
|  1   | Alice |   |100 |   1     | 59.90  |
|  2   | Bob   |   |101 |   1     |120.00  |
|  3   | Cathy |   |102 |   3     |  9.99  |
+------+-------+   +----+---------+--------+

 左联结条件： u.id = o.user_id

 结果：
  - u=1 ↔ o=100、o=101
  - u=2 ↔ 无匹配 → order_id=NULL, amount=NULL
  - u=3 ↔ o=102

结果集：

+---------+-------+----------+--------+
| user_id | name  | order_id | amount |
+---------+-------+----------+--------+
|    1    | Alice |   100    |  59.90 |
|    1    | Alice |   101    | 120.00 |
|    2    | Bob   |   NULL   |  NULL  |
|    3    | Cathy |   102    |   9.99 |
+---------+-------+----------+--------+

2.3 RIGHT JOIN（右联结）

与 LEFT JOIN 对称：返回右表所有行，以及左表中匹配的行；若左表无匹配，左表字段为 NULL。
在 MySQL 中不如 LEFT JOIN 常用，一般可通过互换顺序转换为 LEFT JOIN。

2.4 CROSS JOIN（交叉联结 / 笛卡尔积）

不需要 ON 条件，将左表的每一行与右表的每一行完全匹配，结果行数 = 行数A × 行数B。

语法：

SELECT *
FROM table_a
CROSS JOIN table_b;

多用于生成辅助组合、统计笛卡尔积等；若无意中漏写联结条件，会导致数据量骤增。

3. 高级联结技巧

下面开始深入探讨若干在日常业务中极为实用的“高级联结”技巧。配合完整示例和图解，帮助你迅速上手，并在实际项目中灵活运用。

3.1 多条件与多列联结

当联结条件不止一列时，可以在 ON 中使用多个表达式，并且支持较多复杂表达式（比如范围、计算等）。

示例：多列联结

假设有两张表，一张 products，一张 inventory，它们需要根据 product_id 和 warehouse_id 同时匹配。

CREATE TABLE products (
  product_id INT,
  warehouse_id INT,
  product_name VARCHAR(50),
  PRIMARY KEY (product_id, warehouse_id)
);

CREATE TABLE inventory (
  product_id INT,
  warehouse_id INT,
  stock INT,
  PRIMARY KEY (product_id, warehouse_id)
);

INSERT INTO products VALUES
(1, 10, '笔记本'),
(1, 20, '笔记本（备用）'),
(2, 10, '鼠标'),
(3, 30, '键盘');

INSERT INTO inventory VALUES
(1, 10, 100),
(1, 20, 50),
(2, 10, 200);

查询“每个产品在对应仓库的库存”

SELECT
  p.product_id,
  p.warehouse_id,
  p.product_name,
  i.stock
FROM products AS p
LEFT JOIN inventory AS i
  ON p.product_id = i.product_id
 AND p.warehouse_id = i.warehouse_id;

图解（多列联结示意）

 products                         inventory
+-----------+--------------+      +-----------+--------------+-------+
| product_id| warehouse_id |      | product_id| warehouse_id | stock |
+-----------+--------------+      +-----------+--------------+-------+
|     1     |     10       |      |     1     |     10       | 100   |
|     1     |     20       |      |     1     |     20       |  50   |
|     2     |     10       |      |     2     |     10       | 200   |
|     3     |     30       |      +-----------+--------------+-------+
+-----------+--------------+

 条件： p.product_id = i.product_id AND p.warehouse_id = i.warehouse_id

 结果：
  - (1,10) ↔ (1,10) → stock=100
  - (1,20) ↔ (1,20) → stock=50
  - (2,10) ↔ (2,10) → stock=200
  - (3,30) ↔ 无匹配 → stock=NULL

结果集：

+------------+--------------+--------------+-------+
| product_id | warehouse_id | product_name | stock |
+------------+--------------+--------------+-------+
|     1      |     10       |  笔记本      | 100   |
|     1      |     20       |  笔记本（备用）| 50   |
|     2      |     10       |  鼠标        | 200   |
|     3      |     30       |  键盘        | NULL  |
+------------+--------------+--------------+-------+

3.2 自联结（Self-Join）

自联结指的是一张表与自身做联结，用途非常广泛，比如查询层级关系（员工表查询上级/下级）、查找成对数据、时间序列相邻记录对比等。

示例 1：查找员工表中每个员工对应的直属上级

假设有一个 employees 表，结构如下：

CREATE TABLE employees (
  id INT PRIMARY KEY,
  name VARCHAR(50),
  manager_id INT  -- 指向同一表的 id 列
);
INSERT INTO employees VALUES
(1, '总经理', NULL),
(2, '部门经理A', 1),
(3, '部门经理B', 1),
(4, '员工甲', 2),
(5, '员工乙', 2),
(6, '员工丙', 3);

manager_id 字段指明该员工的上级是谁（根节点的 manager_id 为 NULL）。

查询“每个员工及其上级姓名”

SELECT
  e.id       AS employee_id,
  e.name     AS employee_name,
  m.id       AS manager_id,
  m.name     AS manager_name
FROM employees AS e
LEFT JOIN employees AS m
  ON e.manager_id = m.id;

图解（自联结示意）

 employees (e)                 employees (m)
+----+-----------+------------+    +----+-----------+------------+
| id |   name    | manager_id |    | id |   name    | manager_id |
+----+-----------+------------+    +----+-----------+------------+
| 1  | 总经理    |   NULL     |    | 1  | 总经理    |   NULL     |
| 2  | 部门经理A |     1      |    | 2  | 部门经理A |    1       |
| 3  | 部门经理B |     1      |    | 3  | 部门经理B |    1       |
| 4  | 员工甲    |     2      |    | 4  | 员工甲    |    2       |
| 5  | 员工乙    |     2      |    | 5  | 员工乙    |    2       |
| 6  | 员工丙    |     3      |    | 6  | 员工丙    |    3       |
+----+-----------+------------+    +----+-----------+------------+

 联结： e.manager_id = m.id

 结果示例：
  - e=1 → m=NULL
  - e=2 → m=1
  - e=3 → m=1
  - e=4 → m=2
  - ...

结果集：

+-------------+---------------+------------+--------------+
| employee_id | employee_name | manager_id | manager_name |
+-------------+---------------+------------+--------------+
|      1      | 总经理        |   NULL     |   NULL       |
|      2      | 部门经理A     |     1      |   总经理     |
|      3      | 部门经理B     |     1      |   总经理     |
|      4      | 员工甲        |     2      |   部门经理A  |
|      5      | 员工乙        |     2      |   部门经理A  |
|      6      | 员工丙        |     3      |   部门经理B  |
+-------------+---------------+------------+--------------+

示例 2：查询同一个表中相邻时间戳的记录差值

假设有一张 events 表，记录系统的时间序列数据，需要计算两条相邻记录的时间差（或者数值差）。

CREATE TABLE events (
  id INT PRIMARY KEY AUTO_INCREMENT,
  sensor_id INT,
  recorded_at DATETIME,
  value DECIMAL(10,2)
);
INSERT INTO events (sensor_id, recorded_at, value) VALUES
(100, '2025-06-07 10:00:00', 20.5),
(100, '2025-06-07 10:05:00', 21.0),
(100, '2025-06-07 10:10:00', 20.8),
(200, '2025-06-07 10:00:00', 15.0),
(200, '2025-06-07 10:07:00', 16.2);

查询“每条记录与上一条记录的时间差（秒）”

SELECT
  curr.id            AS curr_id,
  curr.sensor_id     AS sensor,
  curr.recorded_at   AS curr_time,
  prev.recorded_at   AS prev_time,
  TIMESTAMPDIFF(SECOND, prev.recorded_at, curr.recorded_at) AS diff_seconds
FROM events AS curr
LEFT JOIN events AS prev
  ON curr.sensor_id = prev.sensor_id
 AND prev.recorded_at = (
    SELECT MAX(recorded_at)
    FROM events
    WHERE sensor_id = curr.sensor_id
      AND recorded_at < curr.recorded_at
  );

图解（相邻记录匹配）

 events 表（简化视图） for sensor_id=100
+----+----------+---------------------+-------+
| id | sensor_id|     recorded_at     | value |
+----+----------+---------------------+-------+
| 1  |   100    | 2025-06-07 10:00:00 | 20.5  |
| 2  |   100    | 2025-06-07 10:05:00 | 21.0  |
| 3  |   100    | 2025-06-07 10:10:00 | 20.8  |
+----+----------+---------------------+-------+

 对于 curr.id=2：prev = id=1
 对于 curr.id=3：prev = id=2

 diff_seconds:
  - 对 id=2: TIMESTAMPDIFF => 300 (秒)
  - 对 id=3: TIMESTAMPDIFF => 300 (秒)

结果集（部分）：

+---------+--------+---------------------+---------------------+--------------+
| curr_id | sensor |     curr_time       |     prev_time       | diff_seconds |
+---------+--------+---------------------+---------------------+--------------+
|    1    | 100    | 2025-06-07 10:00:00 |      NULL           |     NULL     |
|    2    | 100    | 2025-06-07 10:05:00 | 2025-06-07 10:00:00 |     300      |
|    3    | 100    | 2025-06-07 10:10:00 | 2025-06-07 10:05:00 |     300      |
|    4    | 200    | 2025-06-07 10:00:00 |      NULL           |     NULL     |
|    5    | 200    | 2025-06-07 10:07:00 | 2025-06-07 10:00:00 |     420      |
+---------+--------+---------------------+---------------------+--------------+

技巧点：
以上写法使用了子查询来获取 “上一条” 的 recorded_at。若数据量很大，效率不佳，可考虑使用窗口函数（MySQL 8.0+），如 LAG(recorded_at) OVER (PARTITION BY sensor_id ORDER BY recorded_at) 进行计算。

3.3 多表联结与派生表（Derived Tables）

实际业务场景中，经常需要对多张表进行联结，还可能结合子查询产生的结果再做联结。此时，可使用 派生表（Derived Table） 或 公共表表达式（CTE，MySQL 8.0+） 先对某些中间结果做汇总或筛选，再与其它表联结。

3.3.1 使用派生表

假设有三张表：orders、order_items、products，需要查询“每个用户在过去 30 天内购买金额最大的那一笔订单详情”。

-- 1. orders 表：用户每笔订单的元信息
CREATE TABLE orders (
  id INT PRIMARY KEY,
  user_id INT,
  created_at DATETIME
);

-- 2. order_items 表：订单中的商品明细
CREATE TABLE order_items (
  id INT PRIMARY KEY,
  order_id INT,
  product_id INT,
  quantity INT,
  unit_price DECIMAL(10,2)
);

-- 3. products 表：商品信息
CREATE TABLE products (
  id INT PRIMARY KEY,
  name VARCHAR(50),
  category VARCHAR(20)
);

步骤拆分与派生表思路

先计算每笔订单的总金额：在 order_items 表上进行汇总，得到 order_id → order_total。
筛选过去 30 天内每个用户的最大订单：将上一步得到的总金额与 orders 表联结，按 user_id 分组取 MAX(order_total)。
最终联结商品明细与产品信息，展示完整详情。

具体实现

-- 步骤 1：派生表 A：每笔订单的总金额
SELECT
  oi.order_id,
  SUM(oi.quantity * oi.unit_price) AS order_total
FROM order_items AS oi
GROUP BY oi.order_id;

-- 步骤 2：派生表 B：过去 30 天内每个用户的最大订单
SELECT
  o.user_id,
  o.id AS order_id,
  sub.order_total
FROM orders AS o
JOIN (
    SELECT
      oi.order_id,
      SUM(oi.quantity * oi.unit_price) AS order_total
    FROM order_items AS oi
    GROUP BY oi.order_id
) AS sub
  ON o.id = sub.order_id
WHERE o.created_at >= NOW() - INTERVAL 30 DAY
  -- 先筛选最近 30 天的订单
) AS t_order_totals

-- 再从 t_order_totals 中选出每个 user_id 的最大 order_total
-- 注意：这里可用子查询或派生表二次汇总，也可组合窗口函数简化
SELECT
  user_id,
  order_id,
  order_total
FROM (
  SELECT
    t.user_id,
    t.order_id,
    t.order_total,
    ROW_NUMBER() OVER (PARTITION BY t.user_id ORDER BY t.order_total DESC) AS rn
  FROM (
    -- 包含最近 30 天订单及其总金额
    SELECT
      o.user_id,
      o.id AS order_id,
      SUM(oi.quantity * oi.unit_price) AS order_total
    FROM orders AS o
    JOIN order_items AS oi
      ON o.id = oi.order_id
    WHERE o.created_at >= NOW() - INTERVAL 30 DAY
    GROUP BY o.user_id, o.id
  ) AS t
) AS ranked_orders
WHERE rn = 1;

上面用了多层派生表（内部叠加了窗口函数）。假如你的 MySQL 5.7 不支持窗口函数，也可拆分成多个派生表：

-- A: 每笔订单总额
SELECT
  oi.order_id,
  SUM(oi.quantity * oi.unit_price) AS order_total
FROM order_items AS oi
GROUP BY oi.order_id
INTO TEMPORARY TABLE temp_order_totals;

-- B: 最近 30 天订单 + 总额
SELECT
  o.user_id,
  o.id AS order_id,
  tot.order_total
FROM orders AS o
JOIN temp_order_totals AS tot
  ON o.id = tot.order_id
WHERE o.created_at >= NOW() - INTERVAL 30 DAY
INTO TEMPORARY TABLE temp_recent_totals;

-- C: 每个用户最大订单
SELECT
  user_id,
  MAX(order_total) AS max_total
FROM temp_recent_totals
GROUP BY user_id
INTO TEMPORARY TABLE temp_user_max;

-- D: 将最大订单回联 recent_totals，获取 order_id
SELECT
  r.user_id,
  r.order_id,
  r.order_total
FROM temp_recent_totals AS r
JOIN temp_user_max AS m
  ON r.user_id = m.user_id
 AND r.order_total = m.max_total
INTO TEMPORARY TABLE temp_user_best_order;

-- E: 最后联结 products，展示详情
SELECT
  ubo.user_id,
  ubo.order_id,
  ubo.order_total,
  p.id       AS product_id,
  p.name     AS product_name,
  oi.quantity,
  oi.unit_price
FROM temp_user_best_order AS ubo
JOIN order_items AS oi
  ON ubo.order_id = oi.order_id
JOIN products AS p
  ON oi.product_id = p.id;

技巧点：
利用临时表或派生表分步计算，可显著降低单次查询的复杂度，便于调试与性能分析。
MySQL 8.0 支持 CTE（WITH），可将上面多次派生表逻辑简化为一次完整的WITH ... SELECT 语句，并且根据优化器可以更好地优化执行计划。

3.4 LATERAL（横向联结）与 JSON\_TABLE（MySQL 8.0+）

MySQL 8.0 引入了对 LATERAL 关键字的支持，使得可以在联结时引用左侧查询的列，从而“横向”生成新的行。例如：需要对 JSON 列进行拆分并联结到父表。

示例：将 JSON 数组拆分为多行并联结

假设有一张 invoices 表，列中包含一个 JSON 数组，记录订单的附加费用明细（每个元素含 type/amount）：

CREATE TABLE invoices (
  id INT PRIMARY KEY,
  user_id INT,
  total DECIMAL(10,2),
  fees JSON
);

INSERT INTO invoices (id, user_id, total, fees) VALUES
(1, 101, 100.00, 
 '[
    {"type": "shipping", "amount": 10.00},
    {"type": "tax",      "amount": 8.00}
  ]'
),
(2, 102, 200.00,
 '[
    {"type": "shipping", "amount": 12.00},
    {"type": "tax",      "amount": 16.00},
    {"type": "discount", "amount": -5.00}
  ]');

需求：将每张发票的 `fees` JSON 数组拆分为多行，方便统计各类型费用总额

传统 MySQL 在拆分 JSON 时需要借助存储过程或临时表；MySQL 8.0+ 提供了 JSON_TABLE 函数，结合 LATERAL，能非常简洁地做到这一点。

SELECT
  inv.id            AS invoice_id,
  inv.user_id,
  jt.fee_type,
  jt.fee_amount
FROM invoices AS inv
JOIN JSON_TABLE(
  inv.fees,
  "$[*]"
  COLUMNS (
    fee_type   VARCHAR(20) PATH "$.type",
    fee_amount DECIMAL(10,2) PATH "$.amount"
  )
) AS jt
  ON TRUE;

JSON_TABLE 作用：将 JSON 数组 inv.fees 转换为一个虚拟表 jt，每个数组元素映射为一行，并可通过 COLUMNS 定义要提取的字段。
ON TRUE：因为 JSON_TABLE 本身已经横向展开，等价于 LATERAL。也可以写作 JOIN LATERAL JSON_TABLE(...) AS jt ON TRUE。

图解（JSON\_TABLE 横向联结）

 invoices                   JSON_TABLE(inv.fees)
+----+---------+---------+--------------------------------------+  +-----------+------------+
| id | user_id |  total  |                fees (JSON)          |  | fee_type  | fee_amount |
+----+---------+---------+--------------------------------------+  +-----------+------------+
| 1  |   101   | 100.00  | [ {"type":"shipping","amount":10},   |  | shipping  |   10.00    |
|    |         |         |   {"type":"tax","amount":8} ]         |  | tax       |    8.00    |
| 2  |   102   | 200.00  | [ {"type":"shipping","amount":12},   |  +-----------+------------+
|    |         |         |   {"type":"tax","amount":16},        |
|    |         |         |   {"type":"discount","amount":-5} ]   |  -> 对应展开出每条费用记录
+----+---------+---------+--------------------------------------+

结果集：

+------------+---------+------------+------------+
| invoice_id | user_id | fee_type   | fee_amount |
+------------+---------+------------+------------+
|     1      |  101    | shipping   |   10.00    |
|     1      |  101    | tax        |    8.00    |
|     2      |  102    | shipping   |   12.00    |
|     2      |  102    | tax        |   16.00    |
|     2      |  102    | discount   |   -5.00    |
+------------+---------+------------+------------+

技巧点：
JSON_TABLE 结合 LATERAL（可选关键字）非常适合将嵌套或数组类型转为关系型行。
若不想引入 LATERAL，可直接使用 CROSS JOIN JSON_TABLE(...)，因为 JSON_TABLE 默认对每行 invoices 都横向展开。

3.5 窗口函数（Window Functions）结合联结

MySQL 8.0+ 支持窗口函数，可以在联结查询中避免使用子查询或自联结来获取“第一/最后一条记录”、“排名”等需求。示例如下。

示例：联结每个用户的“最新订单”

假设有两张表：users 和 orders，需要查询每个用户最近提交的一笔订单信息。

SELECT
  u.id          AS user_id,
  u.name        AS user_name,
  o.id          AS order_id,
  o.created_at  AS order_time,
  o.amount
FROM users AS u
LEFT JOIN (
    SELECT
      id,
      user_id,
      amount,
      created_at,
      ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY created_at DESC) AS rn
    FROM orders
) AS o
  ON u.id = o.user_id
 AND o.rn = 1;

通过 ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY created_at DESC) 给每个用户的订单按时间降序编号，最新的订单编号为 1。
然后在外层联结时只保留 rn = 1 的行，即可拿到每个用户最新的订单。

4. 复杂多表联结示例

4.1 多表同时联结（INNER + LEFT + 自联结 + 派生表）

有时需要同时对多张结构不同、需求不同的表进行混合联结。下面通过一组假设的表场景展示综合示例。

表结构

users：用户信息

CREATE TABLE users (
  id INT PRIMARY KEY,
  name VARCHAR(50),
  signup_date DATE
);

orders：订单表

CREATE TABLE orders (
  id INT PRIMARY KEY,
  user_id INT,
  created_at DATETIME,
  status VARCHAR(20)
);

order\_items：订单明细

CREATE TABLE order_items (
  id INT PRIMARY KEY,
  order_id INT,
  product_id INT,
  quantity INT,
  unit_price DECIMAL(10,2)
);

products：商品信息

CREATE TABLE products (
  id INT PRIMARY KEY,
  name VARCHAR(100),
  category VARCHAR(30),
  price DECIMAL(10,2)
);

reviews：商品评价

CREATE TABLE reviews (
  id INT PRIMARY KEY,
  product_id INT,
  user_id INT,
  rating INT,          -- 1-5 星
  review_date DATE
);

需求：

查询所有 2025 年上半年（2025-01-01 到 2025-06-30） 注册的用户。
对这些用户，显示他们最新一次已完成（status = 'completed'）订单的总金额，以及该订单中各商品的名称与购买数量。
同时，如果用户对该订单中的商品有评价（reviews 表里存在对应 product_id 且 user_id = 用户 ID），将评价星级也一并显示；否则用 NULL 占位。
如果用户到目前为止尚未完成任何订单，则以 NULL 显示对应的订单与商品信息。

分析思路：

筛选最近注册用户 → 在 users 表直接用 WHERE signup_date BETWEEN ...。
获得每位用户最新一次已完成订单 → 在 orders 表使用窗口函数（或派生表 + 自联结）得到每个用户最新 completed 状态订单的 order_id。
计算该订单总金额 → 在 order_items 表对该订单进行聚合，得到 order_total。
获取订单中的商品明细 → 在 order_items 与 products 表做 INNER JOIN。
将评价信息联结进来 → 在 products 与 reviews 表上做 LEFT JOIN，条件为 product_id 与 user_id 同时匹配。
若用户无任何已完成订单 → 最终做 users LEFT JOIN 外层所有步骤，以保证用户全部展示。

步骤拆解

步骤 2：获取最新已完成订单（窗口函数示例）

WITH latest_completed AS (
  SELECT
    id         AS order_id,
    user_id,
    created_at,
    ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY created_at DESC) AS rn
  FROM orders
  WHERE status = 'completed'
)
-- 将 CTE 用于后续联结

步骤 3：合并订单总金额

SELECT
  lc.user_id,
  lc.order_id,
  SUM(oi.quantity * oi.unit_price) AS order_total
FROM latest_completed AS lc
JOIN order_items AS oi
  ON lc.order_id = oi.order_id
WHERE lc.rn = 1  -- 只保留最新一笔 completed 订单
GROUP BY lc.user_id, lc.order_id

将上面结果命名为 user_latest_orders。

步骤 4 & 5：订单商品明细 + 评价

SELECT
  ulo.user_id,
  ulo.order_id,
  ulo.order_total,
  p.id         AS product_id,
  p.name       AS product_name,
  oi.quantity  AS purchased_qty,
  r.rating     AS user_rating
FROM (
  -- user_latest_orders CTE/派生
  SELECT
    lc.user_id,
    lc.order_id,
    SUM(oi.quantity * oi.unit_price) AS order_total
  FROM (
    SELECT
      id AS order_id,
      user_id,
      created_at,
      ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY created_at DESC) AS rn
    FROM orders
    WHERE status = 'completed'
  ) AS lc
  JOIN order_items AS oi
    ON lc.order_id = oi.order_id
  WHERE lc.rn = 1
  GROUP BY lc.user_id, lc.order_id
) AS ulo
JOIN order_items AS oi
  ON ulo.order_id = oi.order_id
JOIN products AS p
  ON oi.product_id = p.id
LEFT JOIN reviews AS r
  ON p.id = r.product_id
 AND r.user_id = ulo.user_id;

最终与用户表做 LEFT JOIN

SELECT
  u.id                 AS user_id,
  u.name               AS user_name,
  ulo.order_id,
  ulo.order_total,
  p.product_id,
  p.product_name,
  ulo_items.purchased_qty,
  ulo_items.user_rating
FROM users AS u
LEFT JOIN (
  -- 这是上一步得到的用户与商品明细 + 评价
  SELECT
    ulo.user_id,
    ulo.order_id,
    ulo.order_total,
    p.id            AS product_id,
    p.name          AS product_name,
    oi.quantity     AS purchased_qty,
    r.rating        AS user_rating
  FROM (
    -- user_latest_orders 计算
    SELECT
      lc.user_id,
      lc.order_id,
      SUM(oi.quantity * oi.unit_price) AS order_total
    FROM (
      SELECT
        id AS order_id,
        user_id,
        created_at,
        ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY created_at DESC) AS rn
      FROM orders
      WHERE status = 'completed'
    ) AS lc
    JOIN order_items AS oi
      ON lc.order_id = oi.order_id
    WHERE lc.rn = 1
    GROUP BY lc.user_id, lc.order_id
  ) AS ulo
  JOIN order_items AS oi
    ON ulo.order_id = oi.order_id
  JOIN products AS p
    ON oi.product_id = p.id
  LEFT JOIN reviews AS r
    ON p.id = r.product_id
   AND r.user_id = ulo.user_id
) AS ulo_items
  ON u.id = ulo_items.user_id
WHERE u.signup_date BETWEEN '2025-01-01' AND '2025-06-30'
ORDER BY u.id, ulo_items.order_id, p.category;

整体图解（简化示意，多表联结流程）

users (过滤 2025-01-01 ~ 2025-06-30 注册)
   │
   │ LEFT JOIN                                           （步骤 1+2+3+4+5 合并结果）
   │
   ▼
 user_latest_order_items_with_reviews
   ├─ 用户最新已完成订单（窗口函数 + 聚合）
   ├─ 订单商品明细（order_items ↔ products）
   └─ 联结评价（products ↔ reviews，LEFT JOIN 保证无评价也显示）

5. 联结优化策略

当联结变得非常复杂、涉及多张大表时，查询性能成为关键。以下是一些常见的优化建议与技巧。

5.1 使用合适的索引

联结字段需建索引
- 对 ON a.col = b.col 中的列最好建立索引。
- 若是多列联结（如 (a.col1, a.col2) = (b.col1, b.col2)），可考虑组合索引 (col1, col2)，提高匹配效率。
避免在联结条件中使用函数或表达式
```
-- 不推荐（索引失效）
ON DATE(a.created_at) = b.some_date

-- 推荐
ON a.created_date = b.some_date AND a.created_time >= '00:00:00'
```
尽量将表达式移到查询外层或用派生列预处理，以免 MySQL 无法利用索引。

5.2 小心笛卡尔积

无条件联结 或者 JOIN 时忘记写 ON，会导致笛卡尔积，行数急剧膨胀，严重影响性能。

在多次联结时，务必逐个确认联结条件。例如：

SELECT *
FROM A
JOIN B         -- ← 若忘写 ON，直接与 B 做 CROSS JOIN（笛卡尔积）
JOIN C ON ...  -- 此时 A×B × C 的匹配，效率非常低

5.3 控制中间结果集大小

先筛选、后联结（Push-down Predicate）
- 在能提前过滤的表上先做 WHERE 或者在派生表里做聚合、筛选，避免一次性联结后再做过滤。
- 例如：若只需最近 30 天的订单，就先在 orders 表 WHERE created_at >= NOW() - INTERVAL 30 DAY，再与其它表联结。
使用 EXISTS 或者子查询限制行数
- 对于某些不需要全部列联结而只是判断是否存在，可以使用 EXISTS 或半联结（Semi-Join）提升性能。
```
SELECT u.*
FROM users AS u
WHERE EXISTS (
  SELECT 1
  FROM orders AS o
  WHERE o.user_id = u.id
    AND o.status = 'completed'
);
```
限制行数（LIMIT + 排序）
- 对分页查询或只需要前 N 条记录的场景，尽早使用 LIMIT 并配合索引避免全表扫描。

5.4 查看执行计划（EXPLAIN）

在编写复杂联结前，务必用 EXPLAIN（或 EXPLAIN ANALYZE）预览执行计划：
```
EXPLAIN FORMAT=JSON
SELECT ... FROM ... JOIN ...;
```
关注重点：
- type 应尽量为 ref、range 或 eq_ref，避免 ALL（全表扫描）。
- possible\_keys 和 key：确保联结字段对应的索引被使用。
- rows 估算：若某一步骤需要扫描大量行，考虑提前加筛选条件或改写逻辑。

6. 常见注意事项与最佳实践

明确表别名
- 在多张表联结时，一定要为表起有意义的别名，便于阅读与维护。
- 如 users AS u、orders AS o、order_items AS oi。
避免 SELECT *
- 明确列出所需字段，减少网络传输和服务器 I/O 开销。
- 对于较多列的表，可以使用 SELECT u.id, u.name, o.id, SUM(oi.quantity * oi.unit_price) AS total 这种写法。
使用 STRAIGHT_JOIN 强制指定联结顺序（谨慎）
- MySQL 优化器会自动选择联结顺序。但在某些特殊场景下，优化器选择不理想，可用 STRAIGHT_JOIN 强制让表按 SQL 书写顺序联结。
- 注意：此方式需极度谨慎，仅当确认优化器选择确实不理想时再考虑。
合理拆分业务逻辑
- 当单条 SQL 变得极度复杂时，考虑将其拆分到多个步骤（临时表/派生表/ETL流程）中完成，既利于调试，也能让执行计划更清晰。
利用覆盖索引（Covering Index）
- 如果联结后的查询字段都包含在某个索引中，可减少回表操作，提升查询效率。例如：
```
CREATE INDEX idx_orders_user_status 
  ON orders (user_id, status, created_at, id);
```
- 若查询中用到的字段都在上述索引中，则 MySQL 仅扫描索引即可完成 SELECT。

7. 小结

本文围绕 MySQL 中的高级联结技巧，从基础 JOIN 类型回顾出发，逐步深入到“多列联结”、“自联结”、“派生表（Derived Tables）与 CTE”、“LATERAL 与 JSON\_TABLE”、“窗口函数结合联结”及“多表综合示例”等多个方面，并讲解了联结优化策略与常见注意事项。核心要点如下：

多列与多条件联结：可在 ON 中写任意布尔表达式，有利于精确匹配。
自联结（Self-Join）：适用于层级结构、相邻记录比对等需求，通过将同一表起不同别名实现“自身与自身联结”。
派生表 / CTE：在联结前对中间结果进行预处理（聚合、筛选、排序、窗口函数编号），再与其它表做联结，既清晰又易调试。
LATERAL 与 JSON\_TABLE：MySQL 8.0+ 支持对 JSON 字段进行横向拆分，并与父表数据联结。
窗口函数 + 联结：通过 ROW_NUMBER() / RANK() OVER (...) 等，能快速实现“最新一条”/“排名”类联结需求，效率高于传统子查询方式。
优化策略：为联结字段加索引、避免笛卡尔积、提前筛选、合理拆分查询、查看执行计划（EXPLAIN），是提升性能的关键。

掌握这些技巧后，你能轻松应对各种复杂联结场景，并在实际项目中写出高效、可维护的 SQL。

- 阅读更多 -

Sharding-JDBC详解：掌握MySQL分库分表精髓‌

System

2025-06-04

所有,mysql,中间件,数据库

Sharding-JDBC详解：掌握MySQL分库分表精髓

在互联网大规模应用场景下，单一 MySQL 实例难以承载庞大的读写压力和海量数据。Sharding-JDBC（现归入 Apache ShardingSphere）作为一款轻量级的分库分表中间件，可以在应用层面透明地实现数据库分片（Sharding），既保留了 MySQL 本身的生态优势，又能轻松应对 TB 级甚至 PB 级数据规模。本文将从原理、配置、实战到最佳实践，配合代码示例、Mermaid 图解和详细说明，帮助你快速掌握 Sharding-JDBC 的核心精髓。

什么是 Sharding-JDBC？
Sharding-JDBC 核心原理
2.1. 架构与模块层次
2.2. 分片策略（Sharding Strategy）
2.3. 路由与执行流程
基础环境与依赖准备
配置示例：Spring Boot + Sharding-JDBC
4.1. YAML 配置示例（分库分表）
4.2. Java API 方式配置示例
分库分表策略详解
5.1. 常见分片键与算法
5.2. Transaction 分布式事务支持
5.3. 读写分离（Read/Write Splitting）
数据分片路由与 SQL 拆分
6.1. 单表插入与更新如何路由
6.2. 跨分片 JOIN 和聚合
6.3. 分片键范围查询与隐藏成本
实战：项目代码示例与解释
7.1. 项目结构与依赖说明
7.2. 配置文件解读
7.3. DAO 层调用示例
7.4. 测试与验证效果
Mermaid 图解：Sharding-JDBC 工作流程
进阶话题与最佳实践
9.1. 监控与诊断（Sharding-JDBC Extra）
9.2. 动态分片扩容
9.3. 数据倾斜与热点分片优化
9.4. 分片规则演进与方案迁移
小结

1. 什么是 Sharding-JDBC？

Sharding-JDBC 是Apache ShardingSphere 中的一个组件，作为应用层的分布式数据库中间件，主要功能包括：

分库分表：将数据水平拆分到多张表或多个库，提高单表/单库压力承载能力。
读写分离：将写操作路由到主库，读操作路由到从库，实现读写分离架构。
分布式事务：基于 XA、柔性事务等多种方案，保证跨分片事务一致性。
灵活配置：支持 YAML、Spring Boot 配置、Java API 等多种配置方式，零侵入化集成应用。
生态兼容：完全兼容 JDBC 协议，对上层应用透明，无需改动原有 SQL。

与其他代理型中间件（如 MyCat、Cobar）不同，Sharding-JDBC 直接作为依赖包嵌入应用，无额外部署，易开发、易调试，还能借助 JVM 监控工具做链路跟踪。

2. Sharding-JDBC 核心原理

2.1 架构与模块层次

Sharding-JDBC 的整体架构主要分为以下几层（下图以 Mermaid 形式示意）：

flowchart LR
    subgraph 应用层 Application
        A[用户代码（DAO/Service）] 
    end

    subgraph Sharding-JDBC  (中间件依赖包)
        B1[ShardingDataSource] 
        B2[Sharding-JDBC 核心模块]
        B3[SQL解析 & 路由模块]
        B4[分片策略配置模块]
        B5[读写分离模块]
        B6[分布式事务模块]
    end

    subgraph 存储层 Storage
        C1[DB实例1 (库1)] 
        C2[DB实例2 (库2)] 
        C3[DB实例3 (库3)]
    end

    A --> |JDBC 调用| B1
    B1 --> B2
    B2 --> B3
    B3 --> B4
    B3 --> B5
    B3 --> B6
    B3 --> C1 & C2 & C3

ShardingDataSource
- 对外暴露一个 DataSource，应用直接使用该 DataSource 获取连接，无感知底层多数据库存在。
- 负责拦截并分发所有 JDBC 请求。
SQL 解析 & 路由模块
- 通过 SQLParser 将原始 SQL 解析成 AST（抽象语法树），识别出对应的分片表、分片键等信息。
- 根据配置的分片策略（Sharding Strategy）计算出目标数据节点（库 + 表），并生成路由后的 SQL 片段（如 INSERT INTO t_order_1）。
分片策略配置模块
- 包含分库（DatabaseShardingStrategy）、分表（TableShardingStrategy）、**分表自增主键（KeyGenerator）**等配置、并可定制化算法。
- 内置常见算法：标准分片（Inline）、哈希取模、范围分片、复合分片等。
读写分离模块
- 支持主从复制架构，定义主库和从库的 DataSource 集合。
- 根据 SQL 类型（SELECT、INSERT/UPDATE/DELETE）以及 Hint，可将读操作路由到从库，写操作路由到主库。
分布式事务模块
- 提供两种事务模式：XA事务（强一致性，但性能开销大）和 柔性事务（柔性事务框架，如 Seata）。
- 在多个数据源并行执行操作时，协调事务提交或回滚，保证数据一致性。

2.2 分片策略（Sharding Strategy）

常见分片策略有两种：

标准分片（Standard Sharding）
- 通过配置简单表达式（Inline）或者自定义分片算法，将分片键值映射到具体“库”与“表”。
- 例如，分片键 user_id 取模算法：
  - 数据库数量 dbCount = 2，表数量 tableCount = 4（每个库 2 张表）。
  - dbIndex = user_id % dbCount，tableIndex = user_id % tableCount。
  - 最终路由到：ds_${dbIndex}.t_user_${tableIndex}。
复合分片（Complex Sharding）
- 当一个表需要根据多个字段进行分片时，可以使用复合分片策略（Complex Sharding）。
- 例如：按 user_id 取模分库，按 order_id 取模分表。

2.3 路由与执行流程

下面用 Mermaid 时序图演示一次典型的 SQL 路由执行流程（以 INSERT 为例）：

sequenceDiagram
    participant App as 应用代码
    participant ShardingDS as ShardingDataSource
    participant SQLParser as SQLParser & Analyzer
    participant Routing as 路由模块
    participant DB1 as DB 实例1
    participant DB2 as DB 实例2

    App->>ShardingDS: connection.prepareStatement("INSERT INTO t_order(user_id, amount) VALUES (?, ?)")
    ShardingDS->>SQLParser: 解析 SQL，提取 t_order 与分片键 user_id
    SQLParser-->>Routing: 分片键 user_id = 103
    Routing->>Routing: 计算 dbIndex = 103 % 2 = 1, tableIndex = 103 % 4 = 3
    Routing-->>ShardingDS: 确定目标：ds_1.t_order_3
    ShardingDS->>DB2: 执行 "INSERT INTO t_order_3 ..."
    DB2-->>ShardingDS: 返回结果
    ShardingDS-->>App: 返回执行结果

SQLParser：负责将 SQL 文本解析成 AST，识别出分片表（t_order）和分片键（user_id）。
Routing：基于分片策略计算出目标数据节点。在本例中，user_id 为 103，ds_1 第 2 个库，t_order_3 第 4 张表。
实际执行：ShardingDS 将拼装后的 SQL 发往目标数据库节点。

3. 基础环境与依赖准备

在开始编码之前，先确保本地或服务器环境安装以下组件：

JDK 1.8+
Maven或Gradle构建工具
MySQL 多实例准备：至少两个 MySQL 实例或同机多端口模拟，数据库名可以为 ds_0、ds_1。

Apache ShardingSphere-JDBC 依赖：在 pom.xml 中引入如下核心依赖（以 5.x 版本为例）：

<dependencies>
    <!-- ShardingSphere-JDBC Spring Boot Starter -->
    <dependency>
        <groupId>org.apache.shardingsphere</groupId>
        <artifactId>shardingsphere-jdbc-spring-boot-starter</artifactId>
        <version>5.4.0</version>
    </dependency>
    <!-- MySQL 驱动 -->
    <dependency>
        <groupId>mysql</groupId>
        <artifactId>mysql-connector-java</artifactId>
        <version>8.0.33</version>
    </dependency>
    <!-- Spring Boot Web（可选，根据项目需求） -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>
    <!-- Lombok（可选，用于简化 POJO） -->
    <dependency>
        <groupId>org.projectlombok</groupId>
        <artifactId>lombok</artifactId>
        <version>1.18.28</version>
        <scope>provided</scope>
    </dependency>
</dependencies>

数据库表结构示例：在 ds_0、ds_1 中分别创建逻辑同名的分片表，例如：

-- 在 ds_0 和 ds_1 中分别执行
CREATE TABLE t_order_0 (
    order_id BIGINT AUTO_INCREMENT PRIMARY KEY,
    user_id BIGINT NOT NULL,
    amount DECIMAL(10,2) NOT NULL,
    created_time DATETIME DEFAULT CURRENT_TIMESTAMP
);
CREATE TABLE t_order_1 LIKE t_order_0;
CREATE TABLE t_order_2 LIKE t_order_0;
CREATE TABLE t_order_3 LIKE t_order_0;

这样一来，总共有四张分表：t_order_0、t_order_1（位于 ds_0），t_order_2、t_order_3（位于 ds_1）。

4. 配置示例：Spring Boot + Sharding-JDBC

Sharding-JDBC 的配置方式常见有两种：YAML/Properties 方式（最流行、最简洁）和Java API 方式。下面分别示例。

4.1 YAML 配置示例（分库分表）

在 Spring Boot 项目中，编辑 application.yml，内容示例如下：

spring:
  shardingsphere:
    datasource:
      names: ds_0, ds_1

      ds_0:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3306/ds_0?useUnicode=true&characterEncoding=utf8&serverTimezone=UTC
        username: root
        password: root

      ds_1:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3307/ds_1?useUnicode=true&characterEncoding=utf8&serverTimezone=UTC
        username: root
        password: root

    rules:
      sharding:
        tables:
          t_order:
            actual-data-nodes: ds_${0..1}.t_order_${0..3}
            database-strategy:
              inline:
                sharding-column: user_id
                algorithm-expression: ds_${user_id % 2}
            table-strategy:
              inline:
                sharding-column: user_id
                algorithm-expression: t_order_${user_id % 4}
            key-generator:
              column: order_id
              type: SNOWFLAKE
        default-database-strategy:
          none:
        default-table-strategy:
          none

说明：

datasource.names
- 定义两个 DataSource，ds_0 和 ds_1，分别对应两个物理数据库。
actual-data-nodes
- ds_${0..1}.t_order_${0..3} 表示数据节点为：
  - ds_0.t_order_0, ds_0.t_order_1, ds_0.t_order_2, ds_0.t_order_3
  - ds_1.t_order_0, ds_1.t_order_1, ds_1.t_order_2, ds_1.t_order_3
database-strategy.inline
- 分库策略：根据 user_id % 2 将数据路由到 ds_0 或 ds_1。
table-strategy.inline
- 分表策略：根据 user_id % 4 路由到对应分表。
key-generator
- 自增主键策略，使用 Snowflake 算法生成分布式唯一 order_id。

Mermaid 图解：YAML 配置对应分片结构

flowchart LR
    subgraph ds_0
        T00[t_order_0]  
        T01[t_order_1]  
        T02[t_order_2]  
        T03[t_order_3]
    end
    subgraph ds_1
        T10[t_order_0]
        T11[t_order_1]
        T12[t_order_2]
        T13[t_order_3]
    end

    %% 分库策略：user_id % 2
    A[user_id % 2 = 0] --> T00 & T01
    B[user_id % 2 = 1] --> T10 & T11
    %% 分表策略：user_id % 4
    subgraph ds_0 分表
        A --> |user_id%4=0| T00
        A --> |user_id%4=1| T01
        A --> |user_id%4=2| T02
        A --> |user_id%4=3| T03
    end
    subgraph ds_1 分表
        B --> |user_id%4=0| T10
        B --> |user_id%4=1| T11
        B --> |user_id%4=2| T12
        B --> |user_id%4=3| T13
    end

4.2 Java API 方式配置示例

如果不使用 YAML，而希望通过 Java 代码动态构建 DataSource，可如下示例：

@Configuration
public class ShardingConfig {

    @Bean
    public DataSource shardingDataSource() throws SQLException {
        // 1. 配置 ds_0
        HikariDataSource ds0 = new HikariDataSource();
        ds0.setJdbcUrl("jdbc:mysql://localhost:3306/ds_0?useUnicode=true&characterEncoding=utf8&serverTimezone=UTC");
        ds0.setUsername("root");
        ds0.setPassword("root");

        // 2. 配置 ds_1
        HikariDataSource ds1 = new HikariDataSource();
        ds1.setJdbcUrl("jdbc:mysql://localhost:3307/ds_1?useUnicode=true&characterEncoding=utf8&serverTimezone=UTC");
        ds1.setUsername("root");
        ds1.setPassword("root");

        // 3. 组装 DataSource Map
        Map<String, DataSource> dataSourceMap = new HashMap<>();
        dataSourceMap.put("ds_0", ds0);
        dataSourceMap.put("ds_1", ds1);

        // 4. 配置分片表规则
        ShardingRuleConfiguration shardingRuleConfig = new ShardingRuleConfiguration();

        TableRuleConfiguration orderTableRuleConfig = new TableRuleConfiguration();
        orderTableRuleConfig.setLogicTable("t_order");
        // ds_${0..1}.t_order_${0..3}
        orderTableRuleConfig.setActualDataNodes("ds_${0..1}.t_order_${0..3}");
        // 分库策略
        orderTableRuleConfig.setDatabaseShardingStrategyConfig(new InlineShardingStrategyConfiguration(
                "user_id", "ds_${user_id % 2}"
        ));
        // 分表策略
        orderTableRuleConfig.setTableShardingStrategyConfig(new InlineShardingStrategyConfiguration(
                "user_id", "t_order_${user_id % 4}"
        ));
        // 主键生成策略：Snowflake
        orderTableRuleConfig.setKeyGenerateStrategyConfig(new KeyGenerateStrategyConfiguration(
                "order_id", "SNOWFLAKE"
        ));

        shardingRuleConfig.getTableRuleConfigs().add(orderTableRuleConfig);

        // 5. 构造 ShardingDataSource
        return ShardingDataSourceFactory.createDataSource(
                dataSourceMap,
                shardingRuleConfig,
                new ConcurrentHashMap<>(), // shardingProperties 可留空
                new Properties()
        );
    }
}

说明：
通过 TableRuleConfiguration 定义逻辑表的映射、分库分表策略、主键生成器。
ShardingDataSourceFactory.createDataSource 根据 dataSourceMap 和 ShardingRuleConfiguration 构建 ShardingDataSource，并注册到 Spring 容器。

5. 分库分表策略详解

5.1 常见分片键与算法

选择合适的分片键至关重要，常见注意点如下：

尽量使用可以均匀分布（如 UUID、Snowflake、取模后分布较均匀的自增 ID 等）
避免热点分片：像日期、性别等值域过小、数据量集中度过高的字段，不适合作为分片键。
关联查询考量：如果业务场景需要频繁 JOIN 多张表，且能共享同一个分片键，可让它们沿用同样的分片键与算法，减少跨库 JOIN。

常见算法：

Inline（内联表达式）
- 最简单的方式，通过占位符${} 计算表达式。
- 示例：ds_${user_id % 2}，t_order_${order_id % 4}。
哈希取模（Hash）
- 通过 HashShardingAlgorithm 自定义实现，返回对应库与表。
- 适合分布更均匀、分片数量不固定的场景。
范围分片（Range）
- 通过 RangeShardingAlgorithm，将分片键值域划分成若干范围，如日期区间。
- 适用于时间分片（如按天、按月分表）。

复合分片（Complex）

在分库分表策略同时考虑多个列。例如：

complex:
  sharding-columns: user_id, order_id
  algorithm-expression: ds_${user_id % 2}.t_order_${order_id % 4}

5.2 Transaction 分布式事务支持

当业务涉及跨分片的 多表更新/插入 时，需要保障事务一致性。Sharding-JDBC 支持两种事务模式：

XA 事务（XA Transaction）
- 基于两段式提交协议（2PC），由数据库本身（如 MySQL）支持。
- 配置示例（YAML）：
```
spring:
  shardingsphere:
    rules:
      sharding:
        default-database-strategy: none
        default-table-strategy: none
        default-data-source-name: ds_0
    transaction:
      type: XA
```
- 优点：强一致性、事务隔离级别与单库事务一致。
- 缺点：性能开销较大，要求底层数据库支持 XA，且并发性能不如本地事务。
柔性事务（Base on ShardingSphere-Proxy / Saga / TCC）
- ShardingSphere 5.x 引入了柔性事务（基于 Seata 的 AT 模式或 Saga 模式）。
- 示例配置：
```
spring:
  shardingsphere:
    transaction:
      provider-type: SEATA_AT
```
- 将使用 Seata 注册中心与 TC Server 协调事务，提交速度略快于 XA。
- 需要额外部署 Seata Server 或使用 TCC/Saga 相关框架。

5.3 读写分离（Read/Write Splitting）

在分库分表之外，Sharding-JDBC 还能实现读写分离。其原理是将写操作（INSERT/UPDATE/DELETE）路由到主库，将读操作（SELECT）路由到从库。配置示例如下：

spring:
  shardingsphere:
    datasource:
      names: primary, replica0, replica1
      primary:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3306/primary_db
        username: root
        password: root
      replica0:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3307/replica_db_0
        username: root
        password: root
      replica1:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3308/replica_db_1
        username: root
        password: root

    rules:
      readwrite-splitting:
        data-sources:
          ds_group_0:
            primary-data-source-name: primary
            replica-data-source-names:
              - replica0
              - replica1
            load-balancer:
              type: ROUND_ROBIN

通过 readwrite-splitting 规则，将逻辑 ds_group_0 映射到主库 primary 和从库 replica0、replica1。
配置 load-balancer（负载均衡策略），示例使用轮询（ROUND\_ROBIN）将读请求在两台从库间分发。
应用无需修改 SQL，即可自动将 SELECT 路由到从库，其他写操作路由到主库。

6. 数据分片路由与 SQL 拆分

Sharding-JDBC 在执行 SQL 时，会对原始语句进行拆分并路由到多个数据节点。下面详细探讨几种常见场景。

6.1 单表插入与更新如何路由

以 SQL：INSERT INTO t_order(user_id, amount) VALUES (103, 99.50); 为例：

SQL 解析：识别出逻辑表 t_order、分片键字段 user_id。
计算目标分片节点：
- dsIndex = 103 % 2 = 1 → 数据库 ds_1
- tableIndex = 103 % 4 = 3 → 分表 t_order_3

生成并执行实际 SQL：

INSERT INTO ds_1.t_order_3(user_id, amount) VALUES (103, 99.50);

分片后的 PreparedStatement 只会被发送到 ds_1，其他节点无此业务执行。

6.2 跨分片 JOIN 和聚合

当业务执行以下 SQL 时，Sharding-JDBC 会尝试拆分并在本地做聚合：

SELECT u.user_id, u.name, o.order_id, o.amount
FROM t_user u
JOIN t_order o ON u.user_id = o.user_id
WHERE u.user_id BETWEEN 100 AND 200;

分片表：t_user、t_order 也按照 user_id 做同样分片。对于上述 SQL：

user_id BETWEEN 100 AND 200 对应的 dsIndex 可能为 100%2=0 到 200%2=0 → 实际会包含 ds_0、ds_1 两个库（因为用户区间跨库）。

Sharding-JDBC 会在两个数据节点各自执行对应 SQL：

-- 在 ds_0 上执行
SELECT u.user_id, u.name, o.order_id, o.amount
FROM t_user_0 u
JOIN t_order_0 o ON u.user_id=o.user_id
WHERE u.user_id BETWEEN 100 AND 200;

-- 在 ds_1 上执行
SELECT u.user_id, u.name, o.order_id, o.amount
FROM t_user_0 u
JOIN t_order_0 o ON u.user_id=o.user_id
WHERE u.user_id BETWEEN 100 AND 200;

（假设表规则为 t_user_${user_id%2}、t_order_${user_id%4}，此处简化只示意分库层面分片。）

内存合并：将两个节点返回的结果集合并（Merge），再返回给应用。

Mermaid 图解：跨库 JOIN 过程

flowchart TD
    subgraph 应用发起跨分片 JOIN
        A[SELECT ... FROM t_user JOIN t_order ... WHERE user_id BETWEEN 100 AND 200]
    end
    subgraph Sharding-JDBC 路由层
        A --> B{确定分库节点} 
        B -->|ds_0| C1[路由 ds_0: t_user_0 JOIN t_order_0 ...]
        B -->|ds_1| C2[路由 ds_1: t_user_1 JOIN t_order_1 ...]
    end
    subgraph 数据库层
        C1 --> D1[ds_0 执行 SQL]
        C2 --> D2[ds_1 执行 SQL]
        D1 --> E1[返回结果A]
        D2 --> E2[返回结果B]
    end
    E1 --> F[结果合并 & 排序]
    E2 --> F
    F --> G[最终结果返回给应用]

注意：

跨分片 JOIN 会带来性能开销，因为需要将多个节点的数据拉到应用侧或中间层进行合并。
尽量设计分片键一致的同表 JOIN，或仅在单分片范围内 JOIN，避免全局广播查询。

6.3 分片键范围查询与隐藏成本

对于 SELECT * FROM t_order WHERE user_id > 5000; 这类不带具体等值分片键的范围查询，Sharding-JDBC 只能广播到所有分片节点执行，再合并结果。隐藏成本包括：

跨库网络开销：每个库都要执行同样 SQL，返回大批结果集。
内存合并消耗：Sharding-JDBC 将多个结果集聚合到内存，需要关注 OOM 风险。

优化建议：

尽量通过业务代码指定更精确的分片键（如 AND user_id BETWEEN 1000 AND 2000 AND user_id % 2 = 0）。
使用**提示（Hint）**功能强制 SQL 只路由到特定分片。
定期归档老数据到归档库，减少主分片表数据量。

7. 实战：项目代码示例与解释

下面以一个简易 Spring Boot 项目为例，演示如何集成 Sharding-JDBC，构建订单服务，并验证分库分表效果。

7.1 项目结构与依赖说明

sharding-jdbc-demo/
├── pom.xml
└── src
    ├── main
    │   ├── java
    │   │   └── com.example.sharding
    │   │       ├── ShardingJdbcDemoApplication.java
    │   │       ├── config
    │   │       │   └── ShardingConfig.java
    │   │       ├── entity
    │   │       │   └── Order.java
    │   │       ├── mapper
    │   │       │   └── OrderMapper.java
    │   │       └── service
    │   │           └── OrderService.java
    │   └── resources
    │       └── application.yml
    └── test
        └── java
            └── com.example.sharding
                └── ShardingTest.java

ShardingJdbcDemoApplication：Spring Boot 启动类。
config/ShardingConfig：Java API 方式配置 Sharding-JDBC。
entity/Order：对应数据库分片表 t_order 的实体类。
mapper/OrderMapper：MyBatis 或 Spring JDBC Template DAO。
service/OrderService：业务服务层，提供插入、查询等方法。
application.yml：Sharding-JDBC YAML 配置示例。

7.2 配置文件解读：application.yml

server:
  port: 8080

spring:
  shardingsphere:
    datasource:
      names: ds_0, ds_1

      ds_0:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3306/ds_0
        username: root
        password: root

      ds_1:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3307/ds_1
        username: root
        password: root

    rules:
      sharding:
        tables:
          t_order:
            actual-data-nodes: ds_${0..1}.t_order_${0..3}
            database-strategy:
              inline:
                sharding-column: user_id
                algorithm-expression: ds_${user_id % 2}
            table-strategy:
              inline:
                sharding-column: user_id
                algorithm-expression: t_order_${user_id % 4}
            key-generator:
              column: order_id
              type: SNOWFLAKE

与前文示例一致，指定两个数据源与分片表规则。
t_order 分片表规则写明了 actual-data-nodes、分片策略和 Snowflake 主键生成器。

7.3 DAO 层调用示例：OrderMapper

假设使用 MyBatis，OrderMapper.java 如下：

package com.example.sharding.mapper;

import com.example.sharding.entity.Order;
import org.apache.ibatis.annotations.*;

import java.util.List;

@Mapper
public interface OrderMapper {

    @Insert("INSERT INTO t_order(user_id, amount) VALUES (#{userId}, #{amount})")
    @Options(useGeneratedKeys = true, keyProperty = "orderId")
    int insertOrder(Order order);

    @Select("SELECT order_id, user_id, amount, created_time FROM t_order WHERE user_id = #{userId}")
    List<Order> selectByUserId(@Param("userId") Long userId);

    @Select("SELECT order_id, user_id, amount, created_time FROM t_order WHERE order_id = #{orderId}")
    Order selectByOrderId(@Param("orderId") Long orderId);
}

说明：
insertOrder 不需要关心分片，Sharding-JDBC 会自动将其路由到正确分表并填充主键 orderId。
查询 selectByUserId 会根据分片策略，将 SQL 路由到相应的分表，返回单个分片中的结果集合。
selectByOrderId 若 orderId 作为分片键或暴露了分片信息，可更准确地路由到单表，否则会广播到所有分片，合并后返回。

7.4 Service 层示例：OrderService

package com.example.sharding.service;

import com.example.sharding.entity.Order;
import com.example.sharding.mapper.OrderMapper;
import org.springframework.stereotype.Service;
import org.springframework.transaction.annotation.Transactional;

import java.util.List;

@Service
public class OrderService {

    private final OrderMapper orderMapper;

    public OrderService(OrderMapper orderMapper) {
        this.orderMapper = orderMapper;
    }

    /**
     * 创建订单
     */
    @Transactional
    public Long createOrder(Long userId, Double amount) {
        Order order = new Order();
        order.setUserId(userId);
        order.setAmount(amount);
        orderMapper.insertOrder(order);
        return order.getOrderId();
    }

    /**
     * 根据 user_id 查询该用户所有订单
     */
    public List<Order> getOrdersByUser(Long userId) {
        return orderMapper.selectByUserId(userId);
    }

    /**
     * 根据 order_id 查询订单
     */
    public Order getOrderById(Long orderId) {
        return orderMapper.selectByOrderId(orderId);
    }
}

@Transactional 保证跨分片的单个插入操作也在同一事务上下文中。
获取订单列表（getOrdersByUser）会被 Sharding-JDBC 路由到当前 userId 所在的分片。
若 getOrderById 方法中使用的 orderId 可用来反推出 userId（例如存储了 userId 或在业务层先查询出 userId），则可避免广播查询。

7.5 测试与验证效果：ShardingTest

使用 JUnit 简要验证分库分表效果：

@SpringBootTest
public class ShardingTest {

    @Autowired
    private OrderService orderService;

    @Test
    public void testShardingInsertAndQuery() {
        // 插入不同 userId 的订单
        Long orderId1 = orderService.createOrder(1001L, 50.0);
        Long orderId2 = orderService.createOrder(1002L, 75.0);
        Long orderId3 = orderService.createOrder(1003L, 120.0);

        System.out.println("orderId1 = " + orderId1);
        System.out.println("orderId2 = " + orderId2);
        System.out.println("orderId3 = " + orderId3);

        // 查询 userId=1001 的订单（应路由到 ds_1.t_order_1）
        List<Order> orders1001 = orderService.getOrdersByUser(1001L);
        Assertions.assertFalse(orders1001.isEmpty());

        // 查询 orderId1
        Order o1 = orderService.getOrderById(orderId1);
        Assertions.assertNotNull(o1);
        System.out.println("Fetched Order: " + o1);
    }
}

验证要点：
通过插入多条订单，先查看日志或调试断点，确认 INSERT 路由到不同分片表。
调用 getOrdersByUser 时，Sharding-JDBC 会计算 userId%2 与 userId%4，定位到正确分片。
调用 getOrderById（如果未设置分片键查询），会广播到所有分片，效率略低，应在业务层优化。

8. Mermaid 图解：Sharding-JDBC 工作流程

下面通过 Mermaid 时序图和流程图更加直观地展示 Sharding-JDBC 的工作过程。

8.1 单条插入请求全过程

sequenceDiagram
    participant App as 应用代码
    participant ShardingDS as ShardingDataSource
    participant Parser as SQLParser
    participant Routing as 路由模块
    participant Execute as 执行模块
    participant DB0 as ds_0
    participant DB1 as ds_1

    App->>ShardingDS: getConnection()
    ShardingDS-->>App: Connection

    App->>ShardingDS: prepareStatement("INSERT INTO t_order(user_id, amount) VALUES (101, 59.99)")
    ShardingDS->>Parser: 解析 SQL -> 抽象语法树 (AST)
    Parser-->>Routing: 提取 t_order, sharding_column=user_id=101
    Routing->>Routing: 101 % 2 => 1；101 % 4 => 1
    Routing-->>Execute: 路由到 ds_1.t_order_1
    Execute->>DB1: 执行 "INSERT ds_1.t_order_1(user_id, amount) VALUES (101, 59.99)"
    DB1-->>Execute: 返回执行结果（主键 auto-generated）
    Execute-->>App: 返回执行结果

8.2 读写分离 SQL 路由

flowchart LR
    subgraph 应用 SQL
        A1[SELECT * FROM t_order WHERE order_id = 123] 
        A2[INSERT INTO t_order(…) VALUES (…) ]
    end

    subgraph Sharding-JDBC 路由
        A1 --> B1{读 or 写?}
        B1 -- 读 --> C1[路由到从库 (replica)]
        B1 -- 写 --> C2[路由到主库 (primary)]
        C1 --> DB_read
        C2 --> DB_write
    end

Sharding-JDBC 根据 SQL 类型自动判断读写，将读操作发到从库，写操作发到主库。

9. 进阶话题与最佳实践

9.1 监控与诊断（Sharding-JDBC Extra）

利用 Sharding Analytics 运维工具，可实时查看各分片节点的 QPS、TPS、慢 SQL、热点表等信息。
性能插件：可以通过 Sharding-JDBC 的拦截器或 AOP 插件打印每条 SQL 的路由详情、执行耗时，辅助定位瓶颈。
对于关键 SQL，建议开启SQL 转换开关（SQLShow 或 SQLPrint）以记录实际路由后的真实 SQL，便于调试。

9.2 动态分片扩容

9.2.1 扩容思路

水平扩容数据库实例：新增一个或多个数据库，用于接收新数据分片。
更新分片规则：修改 actual-data-nodes，将新增的数据库纳入分片节点范围。
迁移旧数据：通过脚本或工具，将历史数据从旧节点迁移到新节点，并调整分片键映射（如更新模运算参数）。
灰度切换 & 测试：逐步上线新版分片规则，观察系统情况，最后彻底切换、下线旧分片。

9.2.2 实现示例

假设需要在两个分库基础上新增 ds_2，原分片公式 user_id % 3，分表 user_id % 6。配置变化示例如下：

spring:
  shardingsphere:
    datasource:
      names: ds_0, ds_1, ds_2

      ds_2:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3309/ds_2
        username: root
        password: root

    rules:
      sharding:
        tables:
          t_order:
            actual-data-nodes: ds_${0..2}.t_order_${0..5}
            database-strategy:
              inline:
                sharding-column: user_id
                algorithm-expression: ds_${user_id % 3}
            table-strategy:
              inline:
                sharding-column: user_id
                algorithm-expression: t_order_${user_id % 6}
            key-generator:
              column: order_id
              type: SNOWFLAKE

旧配置：user_id % 2 → 2 库，user_id % 4 → 4 表。
新配置：user_id % 3 → 3 库，user_id % 6 → 6 表。
在 平滑灰度 期间，需要双写到新旧分片（或仅写旧分片、暂缓读取），并逐步迁移历史数据。

9.3 数据倾斜与热点分片优化

诊断：通过监控 QPS、TPS、慢 SQL 等指标，发现某些分片负载明显高于其他。
避免：选取合适分片键，保证数据均匀分布；如使用哈希后缀替代直接自增。
手动干预：对于热点数据，可考虑手动分表、热点拆分（Hot partitioning）或者在应用层进行短暂缓存，降低分片压力。

9.4 分片规则演进与方案迁移

提前设计：最好预估未来数据规模，提前留出足够分片余量，避免频繁变更分片键算法。
弱化分片键依赖：在业务层不要过度依赖隐式分片逻辑，比如不要在业务代码大量写死 ds_${user_id % n}，而应借助 Sharding-JDBC 来管理路由。
物理表名与逻辑表名解耦：不要在应用中直接使用物理分片表名；始终以逻辑表名（t_order）作为编程接口，让 Sharding-JDBC 透明转发。

10. 小结

本文围绕 “Sharding-JDBC详解：掌握MySQL分库分表精髓” 这一主题，从以下几个角度展开了详尽介绍：

Sharding-JDBC 的定位与核心原理
- 作为应用层轻量级分布式中间件，无需额外部署，兼容 JDBC 生态。
- 内部模块划分：DataSource 拦截、SQL 解析与路由、分片策略、读写分离、分布式事务等。
YAML 与 Java API 配置示例
- 详细展示了如何在 Spring Boot 中通过 YAML 或 Java 代码动态配置 DataSource、分片规则、Snowflake 主键生成器等。
- 通过 Mermaid 图解辅助说明分片表、分库策略如何映射到实际物理节点。
分片策略与路由执行流程
- 介绍了标准分片（Inline、Hash）、复合分片、范围分片等策略。
- 剖析了 SQLRouter 如何将原始 SQL 拆解、路由到目标数据节点，并在应用层进行结果合并。
常见问题与优化实践
- 提示跨分片 JOIN、范围查询带来的性能成本，建议尽量限定分片键查询范围。
- 探讨了分布式事务模式（XA、柔性事务）、读写分离、监控诊断、动态扩容、数据倾斜等进阶话题。
完整项目实战示例
- 提供一个可运行的 Spring Boot 示例，演示如何定义 DAO、Service、配置、单元测试，快速验证 Sharding-JDBC 分库分表功能。
- 通过 JUnit 测试展示插入、按 user_id 查询等常见业务场景。
未来演进与最佳实践
- 强调分片键选择对系统均衡性的重要性；
- 建议提前预留分片策略，减少后期迁移成本；
- 提供分片规则变更、数据迁移、灰度发布等常见方案思路。

掌握了 Sharding-JDBC 的核心精髓后，你将能够在不改动应用层业务代码的前提下，轻松实现 MySQL 的分库分表、读写分离与分布式事务，支撑大规模高并发场景。希望本文的代码示例、图解和详细说明能帮助你快速上手、并在实际项目中得心应手地应用 Sharding-JDBC 解决方案。

- 阅读更多 -

ClickHouse集群部署与分布式表引擎实战指南

System

2025-06-03

所有,分布式,数据库

ClickHouse集群部署与分布式表引擎实战指南

说明：本文将从零开始，带你一步步完成 ClickHouse 集群的部署和配置，重点讲解如何利用分布式表（Distributed）引擎实现跨节点的数据分片和查询。文中包含配置文件示例、SQL 代码示例，以及图解帮助你快速理解集群拓扑和引擎原理。

前言
ClickHouse 集群架构概览
- 2.1 集群节点类型
- 2.2 集群拓扑示意图
环境准备
- 3.1 系统要求与依赖
- 3.2 网络与防火墙配置
节点安装与基础配置
- 4.1 单节点安装步骤
- 4.2 配置文件结构说明
- 4.3 常用参数详解
集群级别配置
- 5.1 ZooKeeper 集群部署（可选但推荐）
- 5.2 ClickHouse 配置联动 ZooKeeper
- 5.3 拓扑文件 (cluster.xml) 配置示例
分布式表引擎原理与实战
- 6.1 分布式表（Distributed）引擎基础
- 6.2 本地引擎（MergeTree）与分布式引擎配合
- 6.3 拉取数据与查询路由
- 6.4 具体示例：创建本地表和分布式表
数据导入与查询示例
- 7.1 数据插入到本地分片
- 7.2 通过分布式表进行全局查询
- 7.3 并行查询优化与监控指标
高可用与负载均衡
- 8.1 ZooKeeper 保持节点状态与 Failover
- 8.2 Proxy 层常见方案（例如 HAProxy/Nginx）
- 8.3 查询路由示意图
总结与参考文档

1. 前言

ClickHouse 是一款由 Yandex 开源的高性能列式分布式 OLAP 数据库，擅长海量数据的实时分析与查询。单机部署就能获得非常快的查询速度，而集群化部署则可以水平扩展，支持更大规模的数据存储与并行计算。
本文重点关注：

如何从零搭建一个简单的 ClickHouse 集群
如何使用分布式表（Distributed）引擎将数据分片到多个节点
如何针对高并发查询进行性能优化与监控

通过阅读本文，你将了解 ClickHouse 的集群配置逻辑、分布式表的使用方法，以及集群高可用的最佳实践。

2. ClickHouse 集群架构概览

2.1 集群节点类型

一个典型的 ClickHouse 集群通常包含以下几种角色：

ZooKeeper 节点（可选，推荐）
- 作用：负责存储集群元数据（如分片信息、复制队列等），协调各 ClickHouse 节点之间的分布式一致性。
- 推荐配置：3 节点或以上的 ZooKeeper 集群，保证高可用。
ClickHouse 数据节点（Data Node）
- 作用：存储并处理数据，多数使用 MergeTree 系列引擎。
- 特点：数据根据分片判定规则分布到不同数据节点，节点之间通过 ZooKeeper 协调写操作和复制。
ClickHouse 查询（或 Proxy）节点（可选）
- 作用：接收客户端查询请求，将 SQL 语句路由到下游数据节点，汇总结果后返回客户端。
- 优点：可以屏蔽客户端对集群内部拓扑的感知，实现负载均衡与高可用。

本文示例采用最简化拓扑：
一个 ZooKeeper 集群（3 个节点）
两个 Data Node，分别作为分片的两个副本
一个 Proxy Node 作为统一入口

2.2 集群拓扑示意图

              ┌───────────────────┐
              │   Client (CLI/UI) │
              └────────┬──────────┘
                       │  (1) SQL 请求
                       ▼
             ┌─────────────────────┐
             │  Proxy Node (CH-P)  │
             │  clickhouse-server  │
             └──────────┬──────────┘
                        │ (2) 根据 cluster.xml 路由
      ┌─────────────────┴─────────────────┐
      │                                   │
      ▼                                   ▼
┌──────────────┐                   ┌──────────────┐
│ ClickHouse   │                   │ ClickHouse   │
│ Data Node 1  │                   │ Data Node 2  │
│  (Shard 1)   │                   │  (Shard 2)   │
│ merge_tree1  │                   │ merge_tree1  │
└─────┬────────┘                   └─────┬────────┘
      │                                   │
      │                                   │
      │    ┌─────────────────────────┐    │
      └───▶│    ZooKeeper Cluster   ◀────┘
           │  zk1, zk2, zk3 (3 节点) │
           └─────────────────────────┘

步骤 (1)：Client 将 SQL 请求发送给 Proxy Node。
步骤 (2)：Proxy Node 根据 /etc/clickhouse-server/config.d/cluster.xml 中定义的集群拓扑，将请求分发到对应的 Data Node（Shard）。
Data Node：各自保存本地分片数据，并在 ZooKeeper 中完成分片间的复制协调。
ZooKeeper：存储分片分配信息、复制队列等集群元数据，保证写入的一致性和容错。

3. 环境准备

3.1 系统要求与依赖

操作系统
- 建议使用 CentOS 7/8、Ubuntu 18.04/20.04 或者 Debian 9/10。
- 这里以 Ubuntu 20.04 LTS 为示例，其他 Linux 发行版类似。
机器配置（Data Node）
- CPU：4 核及以上
- 内存：16 GB 及以上
- 磁盘：SSD（至少 200 GB）
- 网络：千兆以太网，保证低延迟
ZooKeeper机器（各 3 节点）
- CPU：2 核
- 内存：4 GB
- 磁盘：机械盘即可，只存储少量元数据
- 配置为三台独立的机器，以保证 ZooKeeper 集群的高可用性
依赖软件
- OpenJDK 8/11（ZooKeeper 依赖）
- wget、curl、tar 等常用命令行工具

3.2 网络与防火墙配置

确保各节点之间可以互通，默认端口：
- ClickHouse：TCP 9000（native），HTTP 8123，TCP 9009（interserver）
- ZooKeeper：TCP 2181（客户端连接），TCP 2888/3888（集群内部通信）
如果启用了防火墙（ufw 或 firewalld），需开放相应端口。示例（Ubuntu 下采用 ufw）：

# 允许 ClickHouse native 协议、HTTP 协议与 interserver 通信
sudo ufw allow 9000/tcp
sudo ufw allow 8123/tcp
sudo ufw allow 9009/tcp

# 允许 ZooKeeper 端口
sudo ufw allow 2181/tcp
sudo ufw allow 2888/tcp
sudo ufw allow 3888/tcp

sudo ufw enable

4. 节点安装与基础配置

4.1 单节点安装步骤

以下示例以 Ubuntu 20.04 为例，演示如何安装 ClickHouse 二进制包。

# 1. 添加 ClickHouse 官方仓库 GPG Key
curl https://packages.clickhouse.com/CLICKHOUSE-KEY.GPG | sudo apt-key add -

# 2. 添加仓库地址
sudo sh -c 'echo "deb https://packages.clickhouse.com/deb stable main" > /etc/apt/sources.list.d/clickhouse.list'

# 3. 更新并安装 clickhouse-server 与 clickhouse-client
sudo apt update
sudo apt install -y clickhouse-server clickhouse-client

# 4. 启动并设置为开机自启
sudo systemctl enable clickhouse-server
sudo systemctl start clickhouse-server

# 5. 验证服务状态
sudo systemctl status clickhouse-server

安装完成后，ClickHouse 默认会在 /etc/clickhouse-server/ 下生成以下关键目录：

config.xml：ClickHouse 全局配置文件
users.xml：用户权限配置文件
config.d/：可放置自定义的扩展配置
users.d/：可放置自定义的用户配置
macros.xml：变量宏定义（常用于集群配置）

4.2 配置文件结构说明

/etc/clickhouse-server/config.xml
- 定义 HTTP 服务端口、Logging、Zookeeper、Interserver 通信等全局参数。
- 示例（简化）：

<yandex>
    <!-- 监听端口 -->
    <tcp_port>9000</tcp_port>
    <http_port>8123</http_port>
    <interserver_http_port>9009</interserver_http_port>

    <!-- 日志与临时目录 -->
    <logger>
        <level>information</level>
        <log>/var/log/clickhouse-server/clickhouse-server.log</log>
        <errorlog>/var/log/clickhouse-server/clickhouse-server.err.log</errorlog>
    </logger>
    <path>/var/lib/clickhouse/</path>
    <tmp_path>/var/lib/clickhouse/tmp/</tmp_path>

    <!-- ZooKeeper 配置（后文将补充） -->
</yandex>

/etc/clickhouse-server/users.xml
- 定义用户及其权限，默认包含一个 default 用户，密码为空，可访问所有数据库。
- 这里最好创建一个强密码的管理员用户，并限制 default 用户只读或禁用。
/etc/clickhouse-server/macros.xml
- 定义集群相关宏（如 {cluster}, {shard}, {replica} 等），在 cluster.xml 中会引用这些宏。
- 示例：

<yandex>
    <macros>
        <!-- 在服务器自己的 config.d/cluster.xml 中，如果需要使用宏可以在此定义 -->
        <cluster>my_clickhouse_cluster</cluster>
        <shard>shard1</shard>
        <replica>replica1</replica>
    </macros>
</yandex>

4.3 常用参数详解

<path> 与 <tmp_path>
- path：ClickHouse 数据文件存储路径，主存储目录。
- tmp_path：临时文件存储路径，如临时排序文件。
<max_concurrent_queries>, <max_memory_usage> 等
- 可以根据机器资源进行调整，避免单个查询占满全部内存或资源。
<listen_host>
- 如果只希望监听特定网卡，可以设置；默认为 0.0.0.0 全网段监听。
<zookeeper>
- 用于指定 ZooKeeper 集群地址（多个节点可使用逗号分隔），示例可在下一节详解。

5. 集群级别配置

5.1 ZooKeeper 集群部署（可选但推荐）

ClickHouse 的副本（Replicated MergeTree）和分布式表（Distributed）很大程度依赖于 ZooKeeper 来实现一致性与协调。若只是做测试，也可以省略 ZooKeeper，但不推荐在生产环境省略。

以下以三台服务器（IP 假设为 10.0.0.1, 10.0.0.2, 10.0.0.3）为例，部署 ZooKeeper 3.7.x。

安装 Java（以 OpenJDK 11 为例）

sudo apt update
sudo apt install -y openjdk-11-jre-headless

下载并解压 ZooKeeper

wget https://dlcdn.apache.org/zookeeper/zookeeper-3.7.1/apache-zookeeper-3.7.1-bin.tar.gz
tar -zxvf apache-zookeeper-3.7.1-bin.tar.gz
sudo mv apache-zookeeper-3.7.1-bin /opt/zookeeper

配置 zoo.cfg
在 /opt/zookeeper/conf/zoo.cfg 中写入：
```
tickTime=2000
initLimit=10
syncLimit=5
dataDir=/var/lib/zookeeper
clientPort=2181

# 下面三行用于集群通信
server.1=10.0.0.1:2888:3888
server.2=10.0.0.2:2888:3888
server.3=10.0.0.3:2888:3888
```
- dataDir：保存 ZooKeeper 元数据的路径，需提前创建并赋予 zookeeper 用户权限。
- server.X：集群内部通信地址，X 为 ID（从 1 起）。

设置 myid 文件

sudo mkdir -p /var/lib/zookeeper
echo "1" | sudo tee /var/lib/zookeeper/myid   # 对于 IP 10.0.0.1 上填入 1
# 第二台 IP 10.0.0.2： echo "2" > /var/lib/zookeeper/myid
# 第三台 IP 10.0.0.3： echo "3" > /var/lib/zookeeper/myid

启动 ZooKeeper
```
cd /opt/zookeeper
bin/zkServer.sh start
```
验证状态
```
bin/zkServer.sh status
```
如果显示 Mode: follower 或 Mode: leader 即可，说明集群已初始化成功。

5.2 ClickHouse 配置联动 ZooKeeper

在每个 ClickHouse Data Node（假设在 10.0.0.11 和 10.0.0.12）上，需要编辑 /etc/clickhouse-server/config.d/zookeeper.xml，将 ZooKeeper 信息写入：

<yandex>
    <zookeeper>
        <!-- 可以指定多个节点，格式：host:port -->
        <node>
            <host>10.0.0.1</host>
            <port>2181</port>
        </node>
        <node>
            <host>10.0.0.2</host>
            <port>2181</port>
        </node>
        <node>
            <host>10.0.0.3</host>
            <port>2181</port>
        </node>
        <!-- 可选：设置会话超时时间 -->
        <session_timeout_ms>300000</session_timeout_ms>
    </zookeeper>
</yandex>

重启 ClickHouse 服务使配置生效：
```
sudo systemctl restart clickhouse-server
```

5.3 拓扑文件（`cluster.xml`）配置示例

在集群模式下，需要在每台 Data Node 上的 /etc/clickhouse-server/config.d/cluster.xml 中定义集群拓扑。例如，假设集群名称为 my_cluster，有两个分片（shard1、shard2），每个分片有两个副本（replica1、replica2），实际 IP 如下：

Shard1:
- Replica1: 10.0.0.11
- Replica2: 10.0.0.12
Shard2:
- Replica1: 10.0.0.13
- Replica2: 10.0.0.14

在所有节点的 /etc/clickhouse-server/config.d/cluster.xml 中，写入：

<yandex>
    <remote_servers>
        <my_cluster>
            <!-- Shard 1 定义 -->
            <shard>
                <replica>
                    <host>10.0.0.11</host>
                    <port>9000</port>
                </replica>
                <replica>
                    <host>10.0.0.12</host>
                    <port>9000</port>
                </replica>
            </shard>
            <!-- Shard 2 定义 -->
            <shard>
                <replica>
                    <host>10.0.0.13</host>
                    <port>9000</port>
                </replica>
                <replica>
                    <host>10.0.0.14</host>
                    <port>9000</port>
                </replica>
            </shard>
        </my_cluster>
    </remote_servers>

    <!-- 定义用于 SQL 中引用的宏 -->
    <macros>
        <cluster>my_cluster</cluster>
        <!-- 注意每个节点还需要在自己的 macros.xml 中定义 shard 与 replica 的值 -->
    </macros>
</yandex>

说明：
<remote_servers>：用于定义集群中可访问的节点分组，名字 my_cluster 可以自定义。
每个 <shard> 下可以定义多个 <replica>，ClickHouse 在写入时会向每个 shard 内的 replica 同步数据。
所有节点都需要能够互相读取到同一份 cluster.xml，否则查询时会出现节点不可达或配置不一致错误。

6. 分布式表引擎原理与实战

6.1 分布式表（Distributed）引擎基础

在 ClickHouse 集群中，通常会结合以下两种引擎来实现分布式写入与查询：

本地引擎：
- 最常用的是 MergeTree（及其变体，比如 ReplicatedMergeTree）。
- 数据存储在节点本地文件系统，支持二级索引、分区、分桶、TTL 等。
分布式引擎（Distributed）：
- 用于将 SQL 查询路由到多个节点的本地表，并将结果合并后返回给客户端。
- 其核心配置包括：
  - cluster：要路由到的集群名（即 cluster.xml 中定义的 <remote_servers>）。
  - database：本地数据库名。
  - table：本地表名。
  - sharding_key（可选）：用于将写入请求按哈希算法路由到不同 shard。

当你向分布式表插入数据时，ClickHouse 会根据 sharding_key 计算出应该插入到哪个 shard，再把这条数据落到对应 shard 的本地表中（若没有明确 sharding_key，则轮询或全部写入）。
当你从分布式表查询时，ClickHouse 会拆分查询，将子查询同时发往各个 shard，然后将各个节点返回的结果做合并、排序、聚合等处理后返回给客户端。

6.2 本地引擎（MergeTree）与分布式引擎配合

下面以 events 表为例，演示如何先在每个节点上创建一个本地的 MergeTree 表，再创建对应的 Distributed 表。

6.2.1 本地表（采用 ReplicatedMergeTree）

在每个 Data Node（假设执行环境是 clickhouse-client 已登录到每个节点）上，先创建一个数据库（若未创建）：

CREATE DATABASE IF NOT EXISTS analytics;

然后在每个节点上执行（注意：{cluster}, {shard}, {replica} 宏需要在各节点的 macros.xml 中预先定义）：

CREATE TABLE analytics.events_local
(
    event_date Date,
    event_time DateTime,
    user_id UInt64,
    event_type String,
    event_properties String
)
ENGINE = ReplicatedMergeTree('/clickhouse/tables/{cluster}/events_local', '{replica}')
PARTITION BY toYYYYMM(event_date)
ORDER BY (event_date, user_id)
TTL event_date + INTERVAL 30 DAY  -- 示例：30 天后自动清理
SETTINGS index_granularity = 8192;

/clickhouse/tables/{cluster}/events_local：ZooKeeper 路径，用于存储副本队列等元数据。
{replica}：宏定义，每台服务器需要在 macros.xml 中设置自己对应的 replica1、replica2 等。
PARTITION BY toYYYYMM(event_date)：按月份分区。
ORDER BY (event_date, user_id)：常见的排序键，可加速基于日期或用户的查询。

执行成功后，系统会在 ZooKeeper 中创建对应的目录结构，并在各副本之间进行数据同步。

6.2.2 分布式表（Distributed）创建

分布式表不存储数据，仅负责查询路由与合并。我们在同一个 analytics 数据库下执行：

CREATE TABLE analytics.events
(
    event_date Date,
    event_time DateTime,
    user_id UInt64,
    event_type String,
    event_properties String
)
ENGINE = Distributed(
    my_cluster,         -- 与 cluster.xml 中 remote_servers 定义保持一致
    analytics,          -- 本地数据库
    events_local,       -- 本地表
    rand()              -- 随机函数，用于插入时随机负载到不同 shard
);

my_cluster：集群名称，对应 cluster.xml 中 <my_cluster>。
analytics：本地库名。
events_local：本地物理表名。
rand()：作为简单示例，将插入的行随机分发到两个 shard；也可以使用更复杂的分片键，比如 user_id % 2 等。

6.3 拉取数据与查询路由

写入数据
向分布式表 analytics.events 插入数据时：
```
INSERT INTO analytics.events VALUES
('2025-06-03', now(), 1001, 'page_view', '{"url": "/home"}'),
('2025-06-03', now(), 1002, 'click', '{"button": "signup"}');
```
ClickHouse 会计算 rand() 或者 sharding_key 决定这两条记录应该插往哪个 shard，然后把它对应的 INSERT 请求转发给目标 shard 的某个副本上执行。
查询数据
当你执行：
```
SELECT event_type, count() 
FROM analytics.events 
WHERE event_date = '2025-06-03'
GROUP BY event_type;
```
ClickHouse 会将此查询拆分成如下子任务：
- 在 Shard1 上执行相同的 SELECT，得到部分聚合结果 [(page_view, 500), (click, 200)]（示例）
- 在 Shard2 上执行相同的 SELECT，得到部分聚合结果 [(page_view, 600), (click, 150)]（示例）
- Proxy Node（或客户端）接收到各个子结果后，进行二次合并：
  - page_view: 500 + 600 = 1100
  - click: 200 + 150 = 350
- 最终返回给客户端：[(page_view, 1100), (click, 350)]。

图解：分布式查询流程

┌───────────────────────────────────────────────────────────────────┐
│                         分布式查询 (Distributed)                 │
│                                                                   │
│  Client/Proxy                                                      │
│  │                                                                │
│  │  1. 下发查询请求                                                │
│  ▼                                                                │
│ +----------------------------+                                     │
│ | Distributed Table Routing  |                                     │
│ +----------------------------+                                     │
│  │                                                                │
│  │  2. 向各个 Shard 分发查询                                         │
│  ▼                                                                │
│  ┌───────────────┐             ┌───────────────┐                   │
│  │  Shard1 (2台) │             │  Shard2 (2台) │                   │
│  │  ┌─────────┐  │             │  ┌─────────┐  │                   │
│  │  │Replica1 │  │             │  │Replica1 │  │                   │
│  │  └─────────┘  │             │  └─────────┘  │                   │
│  │  ┌─────────┐  │             │  ┌─────────┐  │                   │
│  │  │Replica2 │  │             │  │Replica2 │  │                   │
│  │  └─────────┘  │             │  └─────────┘  │                   │
│  └───────────────┘             └───────────────┘                   │
│         ▲                            ▲                             │
│         │  3. 各副本执行聚合并返回部分结果  │                            │
│         │                            │                             │
│         └────── 4. 合并结果 ──────────┘                             │
│                                                                   │
└───────────────────────────────────────────────────────────────────┘

6.4 具体示例：创建本地表和分布式表

本地表（示例）
CREATE TABLE analytics.logs_local
(
    ts DateTime,
    level String,
    message String
)
ENGINE = ReplicatedMergeTree(
    '/clickhouse/tables/{cluster}/logs_local',
    '{replica}'
)
PARTITION BY toYYYYMM(ts)
ORDER BY ts
SETTINGS index_granularity = 4096;
每个副本节点都要执行同样的建表语句。
分布式表（示例）
CREATE TABLE analytics.logs
(
    ts DateTime,
    level String,
    message String
)
ENGINE = Distributed(
    my_cluster,      -- cluster 名称
    analytics,       -- 本地库
    logs_local,      -- 本地表名
    sipHash64(message)  -- 推荐使用哈希函数，保证同一条日志恒定路由到同一 shard
);
通过 sipHash64(message) 分片，能保证同一条日志按照 message 字符串散列值决定落到哪个 shard。
也可使用 rand() 做均匀随机分片，但不保证同一 message 写到同一 shard。

7. 数据导入与查询示例

7.1 数据插入到本地分片

假设我们向分布式表 analytics.events 导入一批 CSV 文件，示例 CSV 文件 events_20250603.csv 内容如下：

2025-06-03,2025-06-03 10:00:00,1001,page_view,{"url":"/home"}
2025-06-03,2025-06-03 10:05:00,1002,click,{"button":"signup"}
2025-06-03,2025-06-03 10:10:00,1001,click,{"button":"purchase"}
2025-06-03,2025-06-03 10:15:00,1003,page_view,{"url":"/product"}

使用 clickhouse-client 导入 CSV
```
clickhouse-client --query="INSERT INTO analytics.events FORMAT CSV" < events_20250603.csv
```
- ClickHouse 会解析 CSV，并将每行数据根据分片策略写入到对应的本地表上。
- 例如第一行的 user_id = 1001，若 rand() 模式下随机写入到 Shard1；若使用 user_id % 2 可能落到 Shard1（1001 % 2 = 1）。
验证本地分片写入情况
- 登录 Shard1 的 Replica1 (10.0.0.11)：
```
clickhouse-client
```
- 查询本地表 events_local 的数据量：
```
SELECT 
    count() AS cnt, 
    shardNumber() AS shard_id
FROM analytics.events_local
GROUP BY shard_id;
```
- 类似地，在 Shard2 (10.0.0.13) 上查看 events_local，对比两边的分布情况。

7.2 通过分布式表进行全局查询

简单聚合查询

SELECT 
    event_type, 
    count() AS total_cnt 
FROM analytics.events
WHERE event_date = '2025-06-03'
GROUP BY event_type 
ORDER BY total_cnt DESC;

该查询会并行发往各个 shard，然后在 Proxy/客户端做最终合并排序。

按用户统计访问量

SELECT 
    user_id, 
    count() AS visits 
FROM analytics.events
WHERE event_date = '2025-06-03' 
  AND event_type = 'page_view' 
GROUP BY user_id 
HAVING visits > 1 
ORDER BY visits DESC 
LIMIT 10;

充分利用 ORDER BY (event_date, user_id) 索引加速。

7.3 并行查询优化与监控指标

并行流（Parallel Replicas）
- 默认情况下，分布式表会读取每个 shard 上第一个可用的副本（顺序无保证）。
- 若想在同一 shard 内的多个副本并行扫描，可设置 distributed_replica_read_mode = 'parallel'。
- 例如在客户端或者 users.xml 中配置：
```
<profiles>
    <default>
        <distributed_replica_read_mode>parallel</distributed_replica_read_mode>
    </default>
</profiles>
```
监控指标
- 在 ClickHouse 内部可以通过系统表 system.metrics、system.events 监控：
  - QueryThreads: 当前并发查询线程数
  - NetworkSendBytes, NetworkReceiveBytes: 网络吞吐
  - MergeTreeParts*: 后台合并状态
- 例如：
```
SELECT 
    metric, 
    value 
FROM system.metrics 
WHERE match(metric, 'Query|Network');
```

8. 高可用与负载均衡

8.1 ZooKeeper 保持节点状态与 Failover

当某个 Data Node 宕机时，ZooKeeper 会检测到节点不可用，ClickHouse Client（或 Proxy）会自动路由到同 shard 下的其他可用副本进行查询与写入。
写操作：写到 ReplicatedMergeTree 时，若当前副本短暂不可用，则写会被暂缓到 ZooKeeper 的队列中，待该副本恢复后自动同步；若整个 shard 下所有副本都不可用，则写入失败。

8.2 Proxy 层常见方案

HAProxy

可以配置 balance roundrobin 或 balance leastconn，将客户端请求分发给多个 ClickHouse 节点。

示例 haproxy.cfg：

global
    log /dev/log    local0
    maxconn 4096
    daemon

defaults
    log     global
    mode    tcp
    option  tcplog
    timeout connect 5s
    timeout client  50s
    timeout server  50s

listen clickhouse
    bind *:9000
    mode tcp
    option tcp-check
    default-server inter 3s fall 3 rise 2
    server ch11 10.0.0.11:9000 check
    server ch12 10.0.0.12:9000 check
    server ch13 10.0.0.13:9000 check
    server ch14 10.0.0.14:9000 check

这样客户端连接到 HAProxy 的 9000 端口，就相当于连接到了一个虚拟的 ClickHouse 集群入口。

Nginx Stream 模块
- 在 nginx.conf 中启用 stream {} 区块，类似 HAProxy 做 TCP 负载均衡。

8.3 查询路由示意图

      ┌────────┐
      │ Client │
      └───┬────┘
          │
          ▼
   ┌───────────────────┐
   │  Load Balancer    │  （HAProxy/Nginx 等）
   │  10.0.0.100:9000  │
   └────────┬──────────┘
            │  (1) 随机或最少连接路由
            ▼
   ┌───────────────┐     ┌───────────────┐
   │ ClickHouse    │     │ ClickHouse    │
   │ Proxy Node    │     │ Data Node 1   │
   │ (Optional)    │     └───────────────┘
   └───────┬───────┘             ▲
           │                      │
           ▼  (2) 按 cluster.xml 路由
   ┌───────────────┐     ┌───────────────┐
   │ ClickHouse    │     │ ClickHouse    │
   │ Data Node 2   │     │ Data Node 3   │
   └───────────────┘     └───────────────┘

客户端连接到负载均衡器 IP，例如 10.0.0.100:9000。
负载均衡器根据配置将请求转给 Proxy Node（若有）或直接给 Data Node。
Proxy Node（若存在）再根据 cluster.xml 路由到对应的分片与副本。

9. 总结与参考文档

9.1 总结

本文详细介绍了如何在生产环境中构建一个基本的 ClickHouse 集群，内容包括：

环境准备与依赖安装：选择合适的操作系统，配置端口与防火墙。
ZooKeeper 集群的部署与配置：保证 ClickHouse 副本间一致性的元数据存储。
ClickHouse 节点安装与基础配置：理解 config.xml、users.xml、macros.xml、cluster.xml 等配置文件的作用。
集群级别配置：编写 cluster.xml 定义分片与副本节点，利用 macros.xml 简化配置。
分布式表引擎（Distributed）实战：先创建本地的 ReplicatedMergeTree 表，再在同库下创建分布式表，将数据分片并行化查询。
数据导入与查询示例：演示如何通过 CSV 导入测试数据，并使用分布式表进行跨分片聚合查询。
高可用与负载均衡：借助 ZooKeeper 实现副本自动切换，使用 HAProxy/Nginx 做查询入口的负载均衡。

通过上述步骤，你可以对 ClickHouse 的集群化部署有一个系统的认识，并掌握使用 Distributed 引擎将数据分布到多个节点、并行查询以提高性能的核心技能。

9.2 参考文档

- 阅读更多 -

MyBatis Plus自动映射失败深度解析：解决数据库表与实体类不匹配问题‌

System

2025-06-02

所有,分布式,java,数据库

MyBatis Plus自动映射失败深度解析：解决数据库表与实体类不匹配问题

在使用 MyBatis Plus 进行数据访问时，往往可以借助其“自动映射”功能，省去大量手动编写 ResultMap 或 @Result 的工作。但在实际开发中，我们常常会遇到“实体类与数据库表字段不完全匹配，导致自动映射失败”的尴尬场景。本文将从原理出发，结合代码示例和图解，详细讲解导致映射失败的常见原因，并给出相应的解决方案。通过阅读，你将系统地理解 MyBatis Plus 的映射规则，学会快速定位与修复实体类与表结构不匹配的问题。

MyBatis Plus 自动映射原理概述
常见导致自动映射失败的原因
2.1. 命名策略不一致（下划线 vs 驼峰）
2.2. 实体字段与表字段类型不匹配
2.3. 字段缺失或多余
2.4. 未配置或配置错误的注解
2.5. 全局配置干扰
案例一：下划线字段与驼峰属性映射失败分析
3.1. 问题再现：表结构 & 实体代码
3.2. MyBatis Plus 默认命名策略
3.3. 失败原因图解与日志分析
3.4. 解决方案：开启驼峰映射或手动指定字段映射
案例二：字段类型不兼容导致映射失败
4.1. 问题再现：表中 tinyint(1) 对应 Boolean
4.2. MyBatis Plus TypeHandler 原理
4.3. 解决方案：自定义或使用内置 TypeHandler
案例三：注解配置不当导致主键识别失败
5.1. 问题再现：@TableId 配置错误或遗漏
5.2. MyBatis Plus 主键策略识别流程
5.3. 解决方案：正确使用 @TableId、@TableName、@TableField
全局配置与自动映射的配合优化
6.1. 全局启用驼峰映射
6.2. 全局字段前缀/后缀过滤
6.3. Mapper XML 与注解映射的配合
工具与调试技巧
7.1. 查看 SQL 日志与返回列
7.2. 使用 @TableField(exist = false) 忽略非表字段
7.3. 利用 IDE 快速生成映射代码
总结与最佳实践

1. MyBatis Plus 自动映射原理概述

MyBatis Plus 在执行查询时，会根据返回结果的列名（ResultSetMetaData 中的列名）与实体类的属性名进行匹配。例如，数据库表有列 user_name，实体类有属性 userName，如果开启了驼峰映射（map-underscore-to-camel-case = true），则 MyBatis Plus 会将 user_name 转换为 userName 并注入到实体中。其基本流程如下：

┌───────────────────────────────┐
│       执行 SQL 查询            │
└───────────────┬───────────────┘
                │
                ▼
┌───────────────────────────────┐
│ JDBC 返回 ResultSet (列名：C)  │
└───────────────┬───────────────┘
                │
                ▼
┌───────────────────────────────┐
│ MyBatis Plus 读取列名 (C)      │
│  1. 若驼峰映射开启：            │
│     将 “下划线” 转换为驼峰       │
│  2. 找到与实体属性 (P) 对应的映射 │
└───────────────┬───────────────┘
                │
                ▼
┌───────────────────────────────┐
│ 调用 Setter 方法，将值注入到 P│
└───────────────────────────────┘

若 C 与 P 无法匹配，MyBatis Plus 就不会调用对应的 Setter，导致该属性值为 null 或默认值。本文将围绕这个匹配过程，深入分析常见问题及解决思路。

2. 常见导致自动映射失败的原因

下面列举常见的几类问题及简要描述：

2.1 命名策略不一致（下划线 vs 驼峰）

表字段 使用 user_name，而实体属性 为 username 或 userName。
未开启 map-underscore-to-camel-case 驼峰映射，导致 user_name 无法匹配 userName。
开启驼峰映射 却在注解上自定义了不同的列名，导致规则冲突。

2.2 实体字段与表字段类型不匹配

SQL 类型：如表中字段是 tinyint(1)，实体属性是 Boolean；MyBatis 默认可能将其映射为 Byte 或 Integer。
大数类型：bigint 对应到 Java 中可能为了精度使用 Long 或 BigInteger，却在实体中写成了 Integer。
枚举类型：数据库存储字符串 “MALE / FEMALE”，实体枚举类型不匹配，导致赋值失败。

2.3 字段缺失或多余

表删除或在新增字段后，忘记在实体类中添加对应属性，导致查询时列未能映射到实体。
实体存在非表字段：需要用 @TableField(exist = false) 忽略，否则映射引擎会报错找不到列。

2.4 未配置或配置错误的注解

@TableName：如果实体类与表名不一致，未使用 @TableName("real_table") 指定真实表名。
@TableField(value = "xxx")：当字段名与实体属性不一致时，需要手动指定，否则自动策略无法匹配。
@TableId：主键映射或 ID 策略配置不正确，导致插入或更新异常。

2.5 全局配置干扰

全局驼峰映射关闭：application.yml 中未开启 mybatis-plus.configuration.map-underscore-to-camel-case=true。
字段前缀/后缀过滤：全局配置了 tableFieldUnderline 或 columnLabelUpper 等参数，影响映射规则。

3. 案例一：下划线字段与驼峰属性映射失败分析

3.1 问题再现：表结构 & 实体代码

假设数据库中有如下表 user_info：

CREATE TABLE user_info (
  id BIGINT PRIMARY KEY AUTO_INCREMENT,
  user_name VARCHAR(50),
  user_age INT,
  create_time DATETIME
);

而对应的实体类 UserInfo 写为：

package com.example.demo.entity;

import com.baomidou.mybatisplus.annotation.TableId;
import com.baomidou.mybatisplus.annotation.TableName;
import java.time.LocalDateTime;

@TableName("user_info")
public class UserInfo {
    @TableId
    private Long id;

    private String userName;
    private Integer userAge;

    // 忘记添加 createTime 字段
    // private LocalDateTime createTime;

    // getters & setters
    public Long getId() { return id; }
    public void setId(Long id) { this.id = id; }

    public String getUserName() { return userName; }
    public void setUserName(String userName) { this.userName = userName; }

    public Integer getUserAge() { return userAge; }
    public void setUserAge(Integer userAge) { this.userAge = userAge; }
}

此时我们执行查询：

import com.example.demo.entity.UserInfo;
import com.example.demo.mapper.UserInfoMapper;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;
import java.util.List;

@Service
public class UserService {
    @Autowired
    private UserInfoMapper userInfoMapper;

    public List<UserInfo> listAll() {
        return userInfoMapper.selectList(null);
    }
}

预期：userName 对应 user_name，userAge 对应 user_age，并将 create_time 映射到一个属性。
实际结果：userName、userAge 的值正常，但 createTime 未定义在实体中，MyBatis Plus 将忽略该列；如果驼峰映射未开启，甚至 userName、userAge 都会是 null。

3.2 MyBatis Plus 默认命名策略

MyBatis Plus 默认使用的命名策略（NamingStrategy.underline_to_camel）会对列名进行下划线转驼峰。但前提条件是在全局配置中或注解中启用该转换：

# application.yml
mybatis-plus:
  configuration:
    # 开启下划线转驼峰映射（驼峰命名）
    map-underscore-to-camel-case: true

如果未配置上面的项，MyBatis Plus 不会对列名做任何转换，从而无法将 user_name 映射到 userName。

3.3 失败原因图解与日志分析

┌───────────────────────────────┐
│       查询结果列列表           │
│  [id, user_name, user_age,    │
│   create_time]                │
└───────────────┬───────────────┘
                │
                ▼
┌───────────────────────────────┐
│ MyBatis Plus自动映射引擎      │
│  1. 读取列名 user_name         │
│  2. 未开启驼峰映射，保持原样   │
│  3. 在实体 UserInfo 中查找属性  │
│     getUser_name() 或 user_name │
│  4. 找不到，跳过该列           │
│  5. 下一个列 user_age 类似处理   │
└───────────────┬───────────────┘
                │
                ▼
┌───────────────────────────────┐
│ 映射结果：                     │
│  id=1, userName=null,         │
│  userAge=null,                │
│  (create_time 忽略)           │
└───────────────────────────────┘

日志示例（Spring Boot 启用 SQL 日志级别为 DEBUG）：

DEBUG com.baomidou.mybatisplus.core.MybatisConfiguration - MappedStatement(id=... selectList, ...) does not have property: user_name
DEBUG com.baomidou.mybatisplus.core.MybatisConfiguration - MappedStatement(id=... selectList, ...) does not have property: user_age
DEBUG com.baomidou.mybatisplus.core.MybatisConfiguration - MappedStatement(id=... selectList, ...) does not have property: create_time

3.4 解决方案：开启驼峰映射或手动指定字段映射

3.4.1 方案1：全局开启驼峰映射

在 application.yml 中加入：

mybatis-plus:
  configuration:
    map-underscore-to-camel-case: true

此时，MyBatis Plus 会执行下划线 → 驼峰转换，user_name → userName。同时，需要在实体中增加 createTime 字段：

private LocalDateTime createTime;

public LocalDateTime getCreateTime() { return createTime; }
public void setCreateTime(LocalDateTime createTime) { this.createTime = createTime; }

3.4.2 方案2：手动指定字段映射

如果不想全局启用驼峰映射，也可在实体类中针对每个字段使用 @TableField 显式指定列名：

@TableName("user_info")
public class UserInfo {
    @TableId
    private Long id;

    @TableField("user_name")
    private String userName;

    @TableField("user_age")
    private Integer userAge;

    @TableField("create_time")
    private LocalDateTime createTime;

    // getters & setters...
}

此时就不依赖全局命名策略，而是用注解进行精确匹配。

4. 案例二：字段类型不兼容导致映射失败

4.1 问题再现：表中 `tinyint(1)` 对应 `Boolean`

在 MySQL 数量中，常常使用 tinyint(1) 存储布尔值，例如：

CREATE TABLE product (
  id BIGINT PRIMARY KEY AUTO_INCREMENT,
  name VARCHAR(100),
  is_active TINYINT(1)  -- 0/1 存布尔
);

如果在实体类中直接写成 private Boolean isActive;，MyBatis Plus 默认会尝试将 tinyint(1) 映射成 Integer 或 Byte，而无法自动转换为 Boolean，导致字段值为 null 或抛出类型转换异常。

4.2 MyBatis Plus TypeHandler 原理

MyBatis Plus 使用 MyBatis 底层的 TypeHandler 机制来完成 JDBC 类型与 Java 类型之间的转换。常见的内置 Handler 包括：

IntegerTypeHandler：将整数列映射到 Integer。
LongTypeHandler：将 BIGINT 映射到 Long。
BooleanTypeHandler：将 JDBC BIT / BOOLEAN 映射到 Java Boolean。
ByteTypeHandler、ShortTypeHandler 等。

MyBatis Plus 默认注册了部分常用 TypeHandler，但对 tinyint(1) → Boolean 并不默认支持（MySQL 驱动会将 tinyint(1) 视为 Boolean，但在不同版本或不同配置下可能不生效）。所以需要显式指定或自定义 Handler。

4.3 解决方案：自定义或使用内置 TypeHandler

4.3.1 方案1：手动指定 `@TableField` 的 `typeHandler`

import org.apache.ibatis.type.JdbcType;
import org.apache.ibatis.type.BooleanTypeHandler;
import com.baomidou.mybatisplus.annotation.TableField;
import com.baomidou.mybatisplus.annotation.TableId;
import com.baomidou.mybatisplus.annotation.TableName;

@TableName("product")
public class Product {
    @TableId
    private Long id;

    private String name;

    @TableField(value = "is_active", jdbcType = JdbcType.TINYINT, typeHandler = BooleanTypeHandler.class)
    private Boolean isActive;

    // getters & setters...
}

jdbcType = JdbcType.TINYINT：告知 MyBatis 列类型为 TINYINT。
typeHandler = BooleanTypeHandler.class：使用 MyBatis 内置的 BooleanTypeHandler，将 0/1 转换为 false/true。

4.3.2 方案2：全局注册自定义 TypeHandler

如果项目中有大量 tinyint(1) → Boolean 的转换需求，可以在全局配置中加入自定义 Handler。例如，创建一个 TinyintToBooleanTypeHandler：

import org.apache.ibatis.type.BaseTypeHandler;
import org.apache.ibatis.type.JdbcType;
import java.sql.*;

public class TinyintToBooleanTypeHandler extends BaseTypeHandler<Boolean> {
    @Override
    public void setNonNullParameter(PreparedStatement ps, int i, Boolean parameter, JdbcType jdbcType) throws SQLException {
        ps.setInt(i, parameter ? 1 : 0);
    }

    @Override
    public Boolean getNullableResult(ResultSet rs, String columnName) throws SQLException {
        int value = rs.getInt(columnName);
        return value != 0;
    }

    @Override
    public Boolean getNullableResult(ResultSet rs, int columnIndex) throws SQLException {
        int value = rs.getInt(columnIndex);
        return value != 0;
    }

    @Override
    public Boolean getNullableResult(CallableStatement cs, int columnIndex) throws SQLException {
        int value = cs.getInt(columnIndex);
        return value != 0;
    }
}

然后在 MyBatis 配置中全局注册：

mybatis-plus:
  configuration:
    type-handlers-package: com.example.demo.typehandler

这样，当 MyBatis Plus 扫描到该包下的 TinyintToBooleanTypeHandler，并结合对应的 jdbcType，会自动触发映射。

5. 案例三：注解配置不当导致主键识别失败

5.1 问题再现：`@TableId` 配置错误或遗漏

假如有如下表 order_info，主键为 order_id，且采用自增策略：

CREATE TABLE order_info (
  order_id BIGINT PRIMARY KEY AUTO_INCREMENT,
  user_id BIGINT,
  total_price DECIMAL(10,2)
);

而实体类定义为：

@TableName("order_info")
public class OrderInfo {
    // 少写了 @TableId
    private Long orderId;

    private Long userId;
    private BigDecimal totalPrice;

    // getters & setters...
}

问题：MyBatis Plus 无法识别主键，默认会根据 id 字段查找或使用全表查询，然后更新/插入策略混乱。
后果：插入时无法拿到自增主键，执行 updateById 会出现 WHERE id = ? 却找不到对应列，导致 SQL 异常或无效。

5.2 MyBatis Plus 主键策略识别流程

MyBatis Plus 在执行插入操作时，如果实体类中没有明确指定 @TableId，会：

尝试查找：判断实体类中是否有属性名为 id 的字段，并将其视作主键。
若无，就无法正确拿到自增主键，会导致 INSERT 后无主键返回，或使用雪花 ID 策略（如果全局配置了）。

在更新时，如果 @TableId 未配置，会尝试从实体的 id 属性获取主键值，导致找不到列名 id 报错。

5.3 解决方案：正确使用 `@TableId`、`@TableName`、`@TableField`

正确的实体应该写成：

package com.example.demo.entity;

import com.baomidou.mybatisplus.annotation.IdType;
import com.baomidou.mybatisplus.annotation.TableId;
import com.baomidou.mybatisplus.annotation.TableName;
import java.math.BigDecimal;

@TableName("order_info")
public class OrderInfo {

    @TableId(value = "order_id", type = IdType.AUTO)
    private Long orderId;

    private Long userId;
    private BigDecimal totalPrice;

    // getters & setters...
}

@TableId(value = "order_id", type = IdType.AUTO)：
- value = "order_id"：指定实际的表主键列名；
- type = IdType.AUTO：使用数据库自增策略。

如果实体属性名与列名不一致，需使用 @TableField 指定：

@TableField("total_price")
private BigDecimal totalPrice;

6. 全局配置与自动映射的配合优化

在实际项目中，各种小错误可能会互相干扰。下面介绍一些常用的全局配置与优化方案。

6.1 全局启用驼峰映射

在 application.yml 中添加：

mybatis-plus:
  configuration:
    map-underscore-to-camel-case: true

效果： 所有查询结果列名如 create_time、user_name 都会自动映射到实体属性 createTime、userName。

6.2 全局字段前缀/后缀过滤

如果表中有公共字段前缀（如 tb_user_name）而实体属性不加前缀，可以在注解或全局策略中进行过滤。例如：

mybatis-plus:
  global-config:
    db-config:
      table-prefix: tb_   # 全局去除表名前缀
      field-strategy: not_empty

6.3 Mapper XML 与注解映射的配合

有时自动映射无法满足复杂场景，可结合 XML 手动编写 ResultMap：

<resultMap id="UserInfoMap" type="com.example.demo.entity.UserInfo">
    <id property="id" column="id" />
    <result property="userName" column="user_name" />
    <result property="userAge" column="user_age" />
    <result property="createTime" column="create_time" />
</resultMap>

<select id="selectAll" resultMap="UserInfoMap">
    SELECT id, user_name, user_age, create_time FROM user_info
</select>

在 Mapper 接口中调用 selectAll() 即可准确映射：

List<UserInfo> selectAll();

7. 工具与调试技巧

以下技巧可帮助你快速定位映射失败的问题：

7.1 查看 SQL 日志与返回列

在 application.yml 中开启 MyBatis Plus SQL 日志：

logging:
  level:
    com.baomidou.mybatisplus: debug
    org.apache.ibatis: debug

启动后，在控制台可以看到：

最终执行的 SQL：帮助确认查询语句。
返回列名：MyBatis 会打印 “不匹配的列” 信息，如 does not have property: user_name，可据此定位实体与列不一致处。

7.2 使用 `@TableField(exist = false)` 忽略非表字段

如果实体类中包含业务特有字段，不对应数据库列，可在属性上加上：

@TableField(exist = false)
private String transientField;

这样 MyBatis Plus 在映射时会忽略该属性，不会报错找不到对应列。

7.3 利用 IDE 快速生成映射代码

工具如 IntelliJ IDEA 的 MyBatis Plus 插件或 MyBatis Generator 可以根据数据库表结构自动生成实体、Mapper 接口和 XML 文件，减少手写注解或 ResultMap 的工作量。

8. 总结与最佳实践

通过本文的分析与多个案例演示，我们可以总结如下最佳实践，以避免或快速定位 MyBatis Plus 自动映射失败的问题：

统一命名规范
- 数据库表字段使用下划线分隔，Java 实体属性使用驼峰命名，并开启全局驼峰映射 map-underscore-to-camel-case=true。
- 若命名风格特殊，务必在实体上使用 @TableField(value = "...") 指定对应列名。
主键与表名注解
- 对于实体与表名不一致的情况，必须显式加上 @TableName("real_table_name")。
- 对于主键字段，务必使用 @TableId(value="col", type=IdType.XXX) 正确指定列名与主键策略。
TypeHandler 匹配
- 注意数据库字段类型与实体属性类型的匹配，特别是布尔字段、时间类型、JSON 类型等。
- 如有需要，自定义或指定合适的 TypeHandler 进行转换。
忽略无关字段
- 实体中非数据库列字段必须加 @TableField(exist = false)，避免映射引擎抛出“找不到对应列”的错误。
日志调试
- 开启 MyBatis Plus 与 MyBatis 的 DEBUG 日志，查看不匹配列和映射过程，有助于快速定位问题。
组合使用 XML 与注解
- 对于过于复杂的查询或特殊映射，可借助 XML 自定义 ResultMap，手动指定列到属性的映射关系。
保持表结构与实体同步
- 开发过程中尽量采用代码生成工具或严格的同步流程，避免表字段变更后忘记更新实体，造成映射失败。

通过遵循上述原则，并灵活运用 MyBatis Plus 提供的注解与配置，你可以快速解决大多数“自动映射失败”的问题，最大程度上发挥 MyBatis Plus 自动化特性，提升开发效率。

- 阅读更多 -

1. 概述：MySQL 锁“坏朋友”与性能挑战

2. 常见锁冲突“重现”：代码演示与分析

2.1 示例表与初始数据

2.2 场景：两会话并发更新相同 user_id 记录

会话 A（Session A）：

会话 B（Session B）：

ASCII 图解：“行锁冲突”示意

3. 避免策略一：缩短事务时间与锁持有周期

3.1 原因

3.2 优化思路

3.3 代码示例：对比“长事务”与“短事务”

不佳做法：长事务（容易造成锁等待）

改进做法：短事务（锁持有时间极短）

4. 避免策略二：合理使用索引，避免全表扫描带来的大范围锁

4.1 原因

4.2 优化思路

4.3 代码示例：索引 vs 无索引

情况 A：无索引，导致全表扫描

情况 B：为 status 建立索引

5. 避免策略三：选择合适的隔离级别，减少“临键锁”带来的额外阻塞

5.1 BBarrier：隔离级别对锁行为的影响

5.2 代码示例：对比 REPEATABLE READ vs READ COMMITTED

5.2.1 REPEATABLE READ 下范围查询加临键锁

5.2.2 READ COMMITTED 下仅加记录锁

6. 避免策略四：尽量使用乐观锁，减少悲观锁带来的锁等待

6.1 悲观锁 vs 乐观锁

6.2 代码示例：使用版本号实现乐观锁

表结构：增加 version 列

A. 悲观锁示例

B. 乐观锁示例

7. 避免策略五：批量操作拆分、分页更新或分区表减少锁冲突

7.1 原因

7.2 优化思路

7.3 代码示例：分批分页更新

7.4 代码示例：分区表减少锁范围

8. 监控与诊断：及时发现锁等待与死锁

8.1 SHOW ENGINE INNODB STATUS 用法

8.2 performance\_schema 和 INFORMATION\_SCHEMA

8.3 查询锁等待次数与死锁总数

9. 小结与最佳实践清单

9.1 核心结论

9.2 实用优化要点清单

1. 什么是死锁

1.1 死锁与普通锁等待的区别

2. InnoDB 中的锁类型概览

3. 示例一：两条记录互相更新导致死锁

3.1 场景描述

3.2 具体代码演示

会话 A（终端 1）

会话 B（终端 2）

并发执行顺序

3.3 ASCII 图解（记录锁交叉）

3.4 InnoDB 死锁检测与回滚

4. 示例二：基于范围查询的间隙锁死锁

4.1 场景描述

4.2 具体代码演示

会话 A（终端 1）

会话 B（终端 2）

并发执行顺序

4.3 典型间隙锁死锁示例

初始数据

会话 A

会话 B

会话 A（典型死锁版）

会话 B

会话 A 继续

会话 B 继续

5. MySQL 中检测与解决死锁

5.1 查看最近一次死锁信息

5.2 应用层面捕获死锁并重试

6. 实战演练：多种死锁场景汇总

6.1 场景一：更新同一张表的两条不同行，顺序不同导致死锁

6.2 场景二：插入唯一索引键值导致死锁

6.3 场景三：插入与更新同时对间隙锁产生冲突

7. 预防与解决死锁的实用技巧

8. 小结

目录

1. 前言与迁移前思考

1.1 迁移前的核心思考

2. MySQL 与 PostgreSQL 差异概述

2.2 场景：两会话并发更新相同 `user_id` 记录

情况 B：为 `status` 建立索引

表结构：增加 `version` 列