2025-06-18

Oracle高水位线（HWM）降低技巧全攻略

在Oracle数据库的性能调优与空间管理中，**高水位线（High Water Mark, HWM）**是一个常被忽视却极具影响力的概念。HWM直接影响全表扫描（FTS）的IO成本和空间利用率，特别是在频繁插入与删除场景下，如果未能及时对其进行调整，可能会导致严重的性能退化和资源浪费。

本文面向有一定Oracle使用经验的读者，深入解析HWM的概念、底层结构、工作机制与优化技巧，并通过示例代码提供实操路径。

一、概念说明：什么是高水位线（HWM）？

在Oracle中，每个表或分区段（segment）都包含一个逻辑边界，称为高水位线（High Water Mark，HWM），它代表了该段中曾被使用过的数据块的最高边界。

HWM的作用：

Oracle在执行全表扫描（Full Table Scan）时，会从段的起始块一直扫描到HWM所在块，即使中间某些块已经空了，也不会跳过。
HWM并不会因为DELETE操作而自动下移，只有在特定操作（如SHRINK SPACE或MOVE）中才可能更新。

二、背景与应用场景

HWM问题容易出现的典型场景：

场景	描述
数据归档	表中有大量历史数据周期性删除，但表结构未重建
批量清理	大表每月清理一次旧数据，导致大量“空块”残留
数据导入导出	使用数据泵导入数据后，大量空间未回收
空间膨胀	表使用PCTFREE/PCTUSED参数不当，数据行移动频繁，空间碎片积累

这些场景下，如果不及时调整HWM，将导致：

FTS读取大量无效块，I/O放大
表实际数据量很小，但占用大量空间
查询响应时间显著增加

三、工作机制图解（文字描述）

插入-删除-扫描流程描述如下：

插入阶段
- Oracle从段头查找空闲块插入数据，当现有区不够用时，会申请新的extent。
- 每次插入新块都会推动HWM向上增长。
删除阶段
- 执行DELETE语句并提交，数据被标记为已删除，但这些块仍被HWM“覆盖”。
- 即使块中数据全无，它们依旧在HWM之下。
查询阶段
- 当执行FTS时（如SELECT COUNT(*) FROM tab），Oracle会扫描从段头到HWM之间所有块。
- 如果有大量“空块”，将造成无谓的I/O开销。
回收阶段
- 只有执行ALTER TABLE ... SHRINK SPACE（ASSM）或ALTER TABLE ... MOVE操作，Oracle才会：
  - 重新整理数据行分布
  - 回收未使用块
  - 重新计算并下调HWM

四、底层原理解析

Oracle表的数据段由多个区（Extent）构成，每个Extent包含多个块（Block）。HWM的本质体现在**段头块（Segment Header Block）**中，以下是核心结构的解析：

1. 段头（Segment Header）

位于段的第一个块中，包含如下信息：
- 当前HWM位置
- 可用区链（Free List，MSSM模式下）
- 高速缓存区状态（ASSM位图）

2. 数据块结构

每个块的状态可为：
- Used：已存储行数据
- Free：可用但未分配
- Deleted：逻辑删除行仍占用块空间
- Never Used：未被使用的块（HWM之上）

3. ASSM vs MSSM

类型	特性	是否支持在线Shrink
MSSM（Manual Segment Space Management）	需维护Free List链表	❌ 不支持
ASSM（Automatic Segment Space Management）	使用位图跟踪块使用情况	✅ 支持SHRINK

五、示例代码讲解

下面是一个真实模拟HWM上升与降低的过程：

1. 创建测试表并插入大量数据

CREATE TABLE hwm_demo (
  id NUMBER,
  payload VARCHAR2(1000)
);

BEGIN
  FOR i IN 1..10000 LOOP
    INSERT INTO hwm_demo VALUES (i, RPAD('A', 1000, 'A'));
  END LOOP;
  COMMIT;
END;

2. 删除大部分数据

DELETE FROM hwm_demo WHERE id <= 9500;
COMMIT;

此时表中仅剩500条数据，但HWM依然很高。

3. 查看表块使用情况（DBA权限）

SELECT table_name, blocks, num_rows
FROM user_tables
WHERE table_name = 'HWM_DEMO';

4. 尝试降低HWM（ASSM下）

ALTER TABLE hwm_demo ENABLE ROW MOVEMENT;
ALTER TABLE hwm_demo SHRINK SPACE;

或使用MOVE方式（适用于MSSM表空间）：

ALTER TABLE hwm_demo MOVE;
-- 注意：需重建索引
ALTER INDEX hwm_demo_idx REBUILD;

六、性能优化建议

定期进行段空间整理
- 尤其是频繁DELETE/ARCHIVE类表
- 每月或每周通过任务调度器自动执行SHRINK或MOVE
合理选择表空间类型
- 新建表空间时尽量启用ASSM（Automatic Segment Space Management）
- 可以使用如下语句创建ASSM表空间：
```
CREATE TABLESPACE assm_ts DATAFILE 'assm01.dbf' SIZE 100M
EXTENT MANAGEMENT LOCAL SEGMENT SPACE MANAGEMENT AUTO;
```
避免频繁迁移或行扩展
- 调整PCTFREE/PCTUSED参数
- 使用ROWDEPENDENCIES减少行迁移风险
监控数据膨胀趋势
- 利用DBA_TABLES、DBA_SEGMENTS等视图监控BLOCKS与NUM_ROWS比值
- 结合AWR报告分析全表扫描的I/O代价
使用分区策略降低单表负担
- 合理设计范围或列表分区，结合子分区进一步减少扫描范围

七、常见错误与解决方案

问题	原因	解决方法
`ORA-10635: Invalid segment or tablespace type`	在MSSM表空间执行SHRINK	改为使用`MOVE`操作，或将表迁移至ASSM表空间
索引失效	`MOVE`或`SHRINK`操作改变ROWID	使用`ALTER INDEX ... REBUILD`重建相关索引
`SHRINK`操作无效或未释放空间	表未启用行移动	执行`ALTER TABLE xxx ENABLE ROW MOVEMENT`
HWM未明显下降	行未被有效重组或数据行仍跨块存储	多次执行SHRINK，或执行`ALTER TABLE ... MOVE`完全重建表

结语

高水位线虽然不是一个显性的性能参数，却实实在在影响着Oracle数据库的查询效率和空间利用率。对高水位线的掌控，是Oracle高级DBA能力的重要体现。建议在实际项目中定期评估大表的HWM状态，结合ASSM管理策略与自动任务计划，系统性地维护数据段健康。

掌握HWM优化，不只是释放空间，更是释放性能潜力。

- 阅读更多 -

PostgreSQL掌握数据库与表操作，揭秘数据类型与运算符详解

System

2025-06-16

所有,数据库

PostgreSQL掌握数据库与表操作，揭秘数据类型与运算符详解

引言

PostgreSQL（简称 PG）是一款功能强大且开源的关系型数据库管理系统，以其稳定性、扩展性和丰富的数据类型著称。本文将带你从数据库和表的基本操作入手，深入剖析 PostgreSQL 中常见的数据类型与运算符，并通过代码示例与图解帮助你快速掌握，轻松上手。

一、数据库操作

1. 创建与删除数据库

-- 创建数据库
CREATE DATABASE demo_db
    WITH
    OWNER = postgres           -- 指定拥有者
    ENCODING = 'UTF8'          -- 字符编码
    LC_COLLATE = 'en_US.utf8'  -- 排序规则
    LC_CTYPE = 'en_US.utf8'    -- 字符分类
    TEMPLATE = template0;      -- 基础模板

-- 删除数据库
DROP DATABASE IF EXISTS demo_db;

2. 查看与连接数据库

-- 查看所有数据库
\l

-- 连接到数据库
\c demo_db

-- 退出 psql 客户端
\q

图1：psql 客户端常用命令流程

┌────────────┐      ┌──────────┐      ┌─────────┐
│ 启动 psql  │ ──→ │ 查看数据库 │ ──→ │ 连接数据库 │
└────────────┘      └──────────┘      └─────────┘

二、表操作

1. 创建表

CREATE TABLE users (
    id SERIAL PRIMARY KEY,         -- 自增主键
    username VARCHAR(50) NOT NULL, -- 用户名
    email VARCHAR(100) UNIQUE,     -- 邮箱唯一
    created_at TIMESTAMP DEFAULT NOW()  -- 创建时间
);

2. 修改表结构

-- 添加列
ALTER TABLE users
ADD COLUMN bio TEXT;

-- 修改列类型
ALTER TABLE users
ALTER COLUMN username TYPE TEXT;

-- 重命名列
ALTER TABLE users
RENAME COLUMN bio TO biography;

3. 删除表

DROP TABLE IF EXISTS users;

4. 查看表结构

-- 查看表的列和约束
\d+ users

图2：表操作流程概览

[创建表] → [插入/查询/更新数据] → [修改表结构] → [删除表]

三、PostgreSQL 常见数据类型

类型类别	数据类型	用途描述
数值类型	`SMALLINT` / `INTEGER` / `BIGINT`	整数，分别对应 2、4、8 字节
	`DECIMAL(p,s)` / `NUMERIC`	定点数，精确到小数位
	`REAL` / `DOUBLE PRECISION`	浮点数，单精度/双精度
字符串类型	`CHAR(n)` / `VARCHAR(n)` / `TEXT`	固定/可变长度字符串
布尔类型	`BOOLEAN`	`TRUE` / `FALSE`
日期时间类型	`DATE` / `TIME` / `TIMESTAMP`	日期、时间、日期+时间
枚举类型	`CREATE TYPE mood AS ENUM ('happy','sad');`	自定义枚举
JSON 类型	`JSON` / `JSONB`	存储 JSON 文档
UUID	`UUID`	通用唯一标识符
数组类型	`integer[]` / `text[]`	任意维度的数组

图解：数据类型选型思路

┌─────────────┐
│ 是否需要精确 │ ── 是 → DECIMAL / NUMERIC
│（货币、财务）│
└─────────────┘
        ↓ 否
┌──────────────┐
│ 是否有枚举集 │ ── 是 → ENUM
└──────────────┘
        ↓ 否
┌─────────────────┐
│ 是否 JSON 结构？│ ── 是 → JSONB
└─────────────────┘
        ↓ 否
使用 INTEGER/TEXT 等通用类型

四、运算符详解

1. 算术运算符

SELECT 10 + 5 AS 加法, 
       10 - 5 AS 减法, 
       10 * 5 AS 乘法, 
       10 / 5 AS 除法, 
       10 % 3 AS 取余;

运算符	含义
`+`	加法
`-`	减法
`*`	乘法
`/`	除法
`%`	取余

2. 比较运算符

SELECT 5 = 5 AS 等于, 
       5 <> 3 AS 不等于, 
       5 > 3 AS 大于, 
       5 < 3 AS 小于, 
       5 >= 5 AS 大于等于, 
       5 <= 3 AS 小于等于;

运算符	含义
`=`	等于
`<>`	不等于
`>`	大于
`<`	小于
`>=`	大于等于
`<=`	小于等于

3. 逻辑运算符

SELECT TRUE AND FALSE AS 逻辑与,
       TRUE OR FALSE  AS 逻辑或,
       NOT TRUE       AS 逻辑非;

运算符	含义
`AND`	逻辑与
`OR`	逻辑或
`NOT`	逻辑非

4. 文本运算符

SELECT 'Hello' || ' ' || 'World' AS 拼接;

运算符	含义
\`		\`	字符串拼接

5. 数组与 JSON 运算符

-- 数组包含
SELECT ARRAY[1,2,3] @> ARRAY[2] AS 包含;

-- JSONB 存取
SELECT '{"a":1,"b":2}'::jsonb -> 'b' AS b键的值;
SELECT '{"a":1,"b":2}'::jsonb ->> 'b' AS b键的文本;

运算符	用途
`@>`	数组/JSON 包含关系
`->`	JSONB 提取字段
`->>`	JSONB 提取文本

五、综合示例

假设有一张订单表 orders，我们结合上述知识点做一次查询：

-- 表结构
CREATE TABLE orders (
    order_id SERIAL PRIMARY KEY,
    user_id INTEGER NOT NULL,
    items JSONB NOT NULL,              -- 存储订单商品列表
    total_amount NUMERIC(10,2) NOT NULL,-- 总金额
    created_at TIMESTAMP DEFAULT NOW()
);

-- 插入示例
INSERT INTO orders (user_id, items, total_amount)
VALUES
(1, '[{"name":"笔记本","price":4999.00},{"name":"鼠标","price":199.00}]', 5198.00),
(2, '[{"name":"键盘","price":299.00}]', 299.00);

-- 查询：筛选总金额大于1000并包含“笔记本”的订单
SELECT order_id, user_id, total_amount,
       items ->> 0 AS first_item
FROM orders
WHERE total_amount > 1000
  AND items @> '[{"name":"笔记本"}]';

解析：

NUMERIC(10,2) 保证货币精度。
items @> '[{"name":"笔记本"}]' 利用 JSONB 包含运算符筛选包含“笔记本”的订单。
items ->> 0 提取 JSON 数组第一个元素并以文本形式输出。

结语

本文系统梳理了 PostgreSQL 数据库与表的基本操作，并详解了常见数据类型与运算符，结合代码示例与图解，帮助你迅速掌握核心概念。掌握之后，你就能灵活地设计表结构、选择合适的数据类型，并用丰富的运算符完成各类查询与数据处理。建议多动手实践，并结合官方文档深入钻研：

官方文档：PostgreSQL Documentation

- 阅读更多 -

MySQL角色权限管理深度剖析：从创建到应用‌

System

2025-06-07

所有,mysql,数据库

本文将从 MySQL 角色权限管理（Role-Based Access Control，RBAC）的原理入手，逐步讲解如何创建角色、分配权限、将角色赋予用户，以及常见的应用场景与最佳实践。全程配合丰富的 SQL 代码示例、ASCII 图解、以及 详细说明，帮助你对 MySQL 角色权限管理有更清晰的认识与实操能力。

1. 概述：为什么要使用角色管理

在生产环境中，数据库用户众多且业务复杂，直接对每个用户单独进行权限配置会带来如下痛点：

权限混乱：同一类用户可能需要相同的权限，但若对每个用户都做一遍 GRANT/LIST，后期运维难以统一管理。
安全风险：若某个用户离职或发生权限变更，需要手动撤销该用户的所有权限，容易遗漏，导致潜在安全隐患。
权限演变难追踪：业务不断发展，权限需要随之调整，单独修改每个用户耗时耗力。

❗MySQL 8.0+ 引入了“角色”（Role）概念，将一组权限 封装成角色，可以一次性将角色赋给多个用户，简化权限管理流程。使用角色后，典型流程如下：

创建角色（Role）：将常见的权限集合打包。
为角色授权：一次性向角色分配所需权限。
为用户分配角色：将角色赋给用户，用户即拥有该角色的所有权限。
动态切换默认角色/启用角色：控制用户在会话层面启用哪些角色（有助于最小权限原则）。

下图示意了角色与用户、权限的关系：

+----------------------+      +----------------------+
|      ROLE_admin      |      |      ROLE_readonly   |
|  (SELECT, UPDATE,    |      | (SELECT ON db.*)     |
|   CREATE, DROP, ...) |      +----------------------+
+-----------+----------+                ^
            |                           |
            |                           |
       ASSIGNED TO                   ASSIGNED TO
            |                           |
  +---------v---------+         +-------v---------+
  |     USER_alice    |         |    USER_bob     |
  | (default roles:   |         |  (default role: |
  |  ROLE_admin)      |         |   ROLE_readonly)|
  +-------------------+         +-----------------+

ROLE_admin 和 ROLE_readonly 是两个角色，分别封装不同权限。
USER_alice 通过分配了 ROLE_admin 拥有管理员权限；USER_bob 拥有只读权限。

2. MySQL 权限系统简要回顾

在 MySQL 中，所有授权记录保存在 mysql 数据库的系统表里，包括：

mysql.user：全局用户级别权限（如 GRANT OPTION、CREATE USER、CREATE TABLESPACE 等）。
mysql.db / mysql.tables_priv / mysql.columns_priv / mysql.procs_priv：分别存储数据库、表、列、存储过程/函数级别的权限。
mysql.role_edges：存储角色之间、角色与用户之间的关联。
mysql.role_edges（自 MySQL 8.0 引入） + 视图 information_schema.enabled_roles / information_schema.role_table_grants / information_schema.role_routine_grants 等，方便查询角色相关信息。

在无角色的场景下，对用户授权通常采用以下步骤：

CREATE USER 'alice'@'%' IDENTIFIED BY 'pwd';
GRANT SELECT, INSERT ON db1.* TO 'alice'@'%';
GRANT UPDATE ON db1.table1 TO 'alice'@'%';
FLUSH PRIVILEGES;

随着业务增长，每个新用户都要重复上述操作，极不便捷。引入角色后，可将第一步和第二步分离：

先创建角色（只需做一次）。
再将角色赋给不同用户（若多个用户需相同权限，只需赋相同角色即可）。

3. 角色基础概念与语法

3.1 角色（Role）的本质

角色只是一个特殊的“虚拟用户”，它本身不用于登录，只负责承载权限。
对角色进行授权（GRANT 权限到角色），而后再将角色“授予”给实际的用户。用户会“继承”所分配角色的权限。
可以创建多个角色并形成层级关系（角色 ↔ 角色），实现权限的更细粒度组合与复用。

3.2 角色的生命周期

创建角色：CREATE ROLE rolename;
向角色授予权限：GRANT privilege ON resource TO rolename;
将角色分配给用户：GRANT rolename TO username;
给用户启用/禁用默认角色：SET DEFAULT ROLE rolename TO username; 或 SET ROLE rolename;
撤销角色权限 / 撤销用户角色关联：相应使用 REVOKE 语句
删除角色：DROP ROLE rolename;

下文将结合示例逐一说明。

4. 创建角色并授予权限

以下示例均基于 MySQL 8.0+，假设已使用具有 CREATE ROLE 权限的账号登陆（通常是具有 GRANT OPTION 或 CREATE USER 权限的管理员账号）。

4.1 创建角色

-- 创建一个名为 'developer' 的角色
CREATE ROLE developer;

-- 批量创建多个角色，一次性逗号分隔
CREATE ROLE admin, readonly_user, analyst;

如果角色已存在，会报错。可用 CREATE ROLE IF NOT EXISTS ... 来避免错误：
```
CREATE ROLE IF NOT EXISTS devops;
```

4.2 授予权限给角色

创建好角色以后，需要向角色分配具体的权限。注意：此时并不涉及任何用户，只是简单地将权限“授予”给角色。

4.2.1 数据库级别授权

-- 将 SELECT、INSERT、UPDATE 授予给 developer 角色，作用于所有 db1.* 表
GRANT SELECT, INSERT, UPDATE
  ON db1.* 
  TO developer;

db1.* 表示该角色在 db1 库下的所有表拥有 SELECT、INSERT、UPDATE 权限。
可多次调用 GRANT，累积权限。例如：
```
GRANT DELETE, DROP ON db1.* TO developer;
```

4.2.2 表级别与列级别授权

-- 将 SELECT、UPDATE 授予给某个表的部分列
GRANT SELECT (col1, col2), UPDATE (col2)
  ON db1.table1
  TO analyst;

-- 将 SELECT ON db2.table2 授予给 readonly_user
GRANT SELECT ON db2.table2 TO readonly_user;

列级别授权：在 (col1, col2) 中列出具体列。
如果不指定列，默认作用于表中所有列。

4.2.3 存储过程/函数级别授权

-- 对存储过程proc_generate_report授权 EXECUTE 权限
GRANT EXECUTE
  ON PROCEDURE db1.proc_generate_report
  TO analyst;

4.2.4 全局级别授权

-- 将 CREATE USER、INSERT、UPDATE、DELETE 等全局权限授予给 admin 角色
GRANT CREATE USER, PROCESS, RELOAD
  ON *.*
  TO admin;

ON *.* 表示全局作用，对所有数据库和所有表生效。
谨慎使用全局权限，仅限 DBA/超级角色使用。

4.3 验证角色拥有的权限

可使用 SHOW GRANTS FOR role_name; 查看角色持有的权限。例如：

SHOW GRANTS FOR developer;

输出示例：

+------------------------------------------------------+
| Grants for developer@%                              |
+------------------------------------------------------+
| GRANT `SELECT`, `INSERT`, `UPDATE` ON `db1`.* TO `developer` |
| GRANT `DELETE`, `DROP` ON `db1`.* TO `developer`     |
+------------------------------------------------------+

如果需要查看更细粒度信息，也可通过 information_schema.role_table_grants、information_schema.role_routine_grants 等视图查询。

5. 将角色分配给用户

角色创建并授予权限后，就可以将角色授权给用户，让用户“继承”角色的所有权限。

5.1 将角色赋予用户

-- 将 developer 角色分配给用户 alice
GRANT developer TO 'alice'@'%';

-- 同时赋予多个角色给同一个用户
GRANT developer, analyst TO 'bob'@'192.168.1.%';

GRANT role_name TO user_name 语句会在系统表 mysql.role_edges 写入关联关系：角色 ↔ 用户。
MySQL 中，角色名与用户标识符同在一个命名空间，但角色不能用于登录。用户只能使用 CREATE USER 创建，而角色只能使用 CREATE ROLE 创建。

5.2 设置默认角色

当用户拥有多个角色时，登录后要“启用”哪些角色才能真正生效？MySQL 支持为用户设置“默认角色”，即在用户登录时，哪些角色自动被启用（ENABLE）。

查看用户当前拥有的角色：

-- 查询 user_alice 拥有的角色
SELECT 
  ROLE,  
  IS_DEFAULT  
FROM mysql.role_edges  
WHERE TO_USER = 'alice' AND TO_HOST = '%';

或者：

SELECT * FROM information_schema.enabled_roles 
WHERE GRANTEE = "'alice'@'%'";

将某个角色设置为默认角色：

-- 让 alice 登录时默认启用 developer
SET DEFAULT ROLE developer TO 'alice'@'%';

将多个角色设置为默认角色：

SET DEFAULT ROLE developer, analyst TO 'bob'@'192.168.1.%';

将默认角色全部禁用（登录后用户需要手动使用 SET ROLE 才能启用）：
```
SET DEFAULT ROLE NONE TO 'alice'@'%';
```

查看当前默认角色：

SELECT DEFAULT_ROLE  
FROM information_schema.user_privileges  
WHERE GRANTEE = "'alice'@'%'";

5.3 手动启用/切换角色

在某些场景下，用户登录后想临时启用或者切换到其它角色，可以使用 SET ROLE 命令。

-- 启用 developer 角色
SET ROLE developer;

-- 启用多个角色
SET ROLE developer, analyst;

-- 禁用当前所有角色，相当于只保留自己帐号的直接权限
SET ROLE NONE;

-- 查看当前启用的角色
SELECT CURRENT_ROLE();

5.3.1 示例流程

假设用户 charlie 被授予了 developer 和 readonly_user 两个角色，但默认只设为 readonly_user：

-- 授予角色
GRANT developer TO 'charlie'@'%';
GRANT readonly_user TO 'charlie'@'%';

-- 设定默认只启用 readonly_user
SET DEFAULT ROLE readonly_user TO 'charlie'@'%';

charlie 登录后，系统自动只启用 readonly_user 角色，拥有只读权限。
若要执行写操作（需要 developer 角色），在会话中执行：
```
SET ROLE developer;
```
此时同时保留了readonly_user的权限，也启用了developer，拥有读写权限。
如果执行完写操作后需要切换回只读环境，可以运行：
```
SET ROLE readonly_user;
```
也可用：
```
SET ROLE NONE;
```
恢复为只保留直接授予用户的权限（若未直接对用户授予任何权限，则相当于无权限）。

6. 撤销角色与权限

在运维过程中，可能需要撤销角色中的某些权限、将角色与用户解绑，或删除角色本身。

6.1 从角色中撤销权限

与 GRANT … TO role 对应，使用 REVOKE 撤销角色上的权限。例如：

-- 从 developer 角色撤销 DELETE 权限
REVOKE DELETE ON db1.* FROM developer;

-- 从 readonly_user 角色撤销对 db2.table2 的 SELECT 权限
REVOKE SELECT ON db2.table2 FROM readonly_user;

REVOKE privilege ON resource FROM role_name;
如果角色不再持有任何权限，可以考虑直接删除角色（下一节）。

6.2 从用户撤销角色

-- 将 developer 角色从 alice 身上撤销
REVOKE developer FROM 'alice'@'%';

-- 一次性撤销多个角色
REVOKE developer, analyst FROM 'bob'@'192.168.1.%';

REVOKE role_name FROM user_name; 会删除系统表 mysql.role_edges 中的对应记录，用户不再继承该角色的权限。
如果想将用户的所有角色一次性撤销，可以：
```
REVOKE ALL ROLES FROM 'alice'@'%';
```

6.3 删除角色

当一个角色不再需要时，可以将其彻底删除。

-- 删除角色
DROP ROLE developer;

-- 如果要删除多个角色
DROP ROLE developer, analyst, readonly_user;

在删除角色之前，建议先确认已将角色从所有用户身上撤销 (REVOKE <role> FROM ALL)。
如果角色仍被某些用户拥有，删除时会将关联一并删除，但需谨慎操作，避免用户瞬间失去权限。

7. 角色与角色之间的嵌套（层级角色）

MySQL 支持将一个角色赋予另一个角色，从而形成层级（继承）的关系。这样可以将常见权限归纳到多个“父角色”，再让“子角色”继承，达到权限复用与拆分的目的。

    +----------------------+
    |    ROLE_sysadmin     |
    | (CREATE USER, DROP   |
    |  PERSISTED, RELOAD)  |
    +----------+-----------+
               |
        GRANT TO v
               |
    +----------v-----------+
    |    ROLE_devops       |
    | (继承 sysadmin +    |
    |   SELECT, INSERT)   |
    +----------+-----------+
               |
         GRANT TO v
               |
    +----------v-----------+
    |    ROLE_developer    |
    | (继承 devops +       |
    |   SELECT, UPDATE)    |
    +----------------------+

7.1 将角色授权给角色

-- 第一步：创建三个角色
CREATE ROLE sysadmin, devops, developer;

-- 给 sysadmin 授予全局管理权限
GRANT CREATE USER, RELOAD, PROCESS ON *.* TO sysadmin;

-- 给 devops 授予 SELECT、INSERT 权限
GRANT SELECT, INSERT ON devdb.* TO devops;

-- 给 developer 授予 UPDATE 权限
GRANT UPDATE ON devdb.* TO developer;

-- 第二步：设置角色层级关系
-- 让 devops 角色继承 sysadmin
GRANT sysadmin TO devops;

-- 让 developer 角色继承 devops
GRANT devops TO developer;

上述操作后，developer 角色将拥有：
1. UPDATE ON devdb.*（自身权限）
2. SELECT, INSERT ON devdb.*（来自 devops）
3. CREATE USER, RELOAD, PROCESS（来自 sysadmin）

7.2 验证角色层级关系

可通过 SHOW GRANTS FOR devops; 看到 devops 本身权限以及继承自 sysadmin 的权限。

也可查询系统表：

SELECT * 
  FROM mysql.role_edges 
 WHERE FROM_USER = 'sysadmin' OR FROM_USER = 'devops';

示例返回：

+-----------+----------+-------------+---------+
| FROM_HOST | FROM_USER| TO_HOST     | TO_USER |
+-----------+----------+-------------+---------+
| %         | sysadmin | %           | devops  |
| %         | devops   | %           | developer |
+-----------+----------+-------------+---------+

表示 sysadmin → devops，devops → developer。

8. 会话级别角色启用与安全考虑

8.1 会话中启用/禁用角色的安全策略

在某些安全敏感场景下，希望用户默认只能使用最少权限，只有在特定会话中才会启用更高权限的角色。这可以通过如下方式实现：

设置默认角色为空：
```
SET DEFAULT ROLE NONE TO 'dba_user'@'%';
```
这样 dba\_user 登录后没有任何角色启用，只拥有直接授予该用户的权限（通常是极少权限）。

在需要权限时，手动启用角色：

-- 登录后
SET ROLE admin;  -- 启用 admin 角色

会话结束后角色失效：
下次 dba\_user 登录时，依然无角色启用，需要再次手动 SET ROLE admin;。

8.2 最小权限原则与审计

原则：尽量让用户只获取完成对应任务的最小权限，不要赋予过多全局或敏感权限。
使用角色便于审计：可以在审计审查时，只需查看哪个用户被授予了哪个角色，而非查看每个用户的所有权限。
禁止随意赋予 GRANT OPTION：避免用户自行再向他人分配/创建角色。只有少数超级管理员角色才应拥有 GRANT OPTION 权限。

9. 查询与维护角色权限信息

MySQL 提供了多种方式来查看角色、用户与权限之间的映射、以及角色本身的权限。

9.1 查看角色持有的权限

SHOW GRANTS FOR 'developer'@'%';

会列出所有针对 developer 角色的授权（包括直接授权和继承授权）。

9.2 查看用户拥有的角色

-- 查看 alice 拥有的角色以及是否为默认角色
SELECT 
    FROM_USER AS role_name, 
    IS_DEFAULT 
FROM mysql.role_edges 
WHERE TO_USER = 'alice' AND TO_HOST = '%';

或通过视图：

SELECT ROLE, IS_DEFAULT
  FROM information_schema.enabled_roles
 WHERE GRANTEE = "'alice'@'%'";

9.3 查看用户继承的所有权限

SHOW GRANTS FOR 'alice'@'%';

该命令会同时列出 alice 的直接权限、通过角色继承的权限，以及角色层级继承的权限，便于综合查看。

9.4 查看角色层级关系

SELECT 
    FROM_USER AS parent_role, 
    TO_USER   AS child_role
FROM mysql.role_edges
WHERE FROM_USER IN ('sysadmin','devops','developer', ...);

通过 mysql.role_edges 可以可视化角色之间的继承关系，有助于把握角色层级结构。

10. 常见应用场景示例

下面通过几个典型场景，演示角色权限管理在实际项目中的应用。

10.1 场景一：开发/测试/生产环境隔离

需求：同一个应用在开发测试环境和生产环境使用同一个数据库账号登录，为了安全，生产环境账号不允许执行 DDL，只能读写特定表；开发环境账号可以执行 DDL、调试函数等。

10.1.1 设计角色

role_prod_rw：生产环境读写角色，只允许 SELECT, INSERT, UPDATE, DELETE 。
role_dev_all：开发环境角色，除了上面操作，还需 CREATE, DROP, ALTER 等 DDL 权限。

-- 创建角色
CREATE ROLE role_prod_rw, role_dev_all;

-- 为 role_prod_rw 授权只读写权限
GRANT SELECT, INSERT, UPDATE, DELETE
  ON appdb.* 
  TO role_prod_rw;

-- 为 role_dev_all 授权所有权限（谨慎）
GRANT ALL PRIVILEGES 
  ON appdb.* 
  TO role_dev_all;

10.1.2 赋予给用户

-- 生产账号 prod_user 只拥有 role_prod_rw
GRANT role_prod_rw TO 'prod_user'@'%';
SET DEFAULT ROLE role_prod_rw TO 'prod_user'@'%';

-- 开发账号 dev_user 拥有 dev_all 和 prod_rw（方便与生产数据同步）
GRANT role_dev_all, role_prod_rw TO 'dev_user'@'%';
SET DEFAULT ROLE role_dev_all TO 'dev_user'@'%';

prod_user 登录后自动启用 role_prod_rw，只能做增删改查。
dev_user 登录后自动启用 role_dev_all，拥有完整权限，可执行表结构变更、存储过程调试等。

10.2 场景二：分离业务功能与审计需求

需求：数据库中有多个业务模块，每个模块对应一个数据库，比如 sales_db、hr_db。有些用户只需要访问 sales_db，有些只访问 hr_db；此外，需要一个 auditor 角色，只能读取所有库但不能修改。

10.2.1 创建与授权

-- 创建业务角色
CREATE ROLE role_sales, role_hr;

-- 创建审计角色
CREATE ROLE role_auditor;

-- role_sales 只读写 sales_db
GRANT SELECT, INSERT, UPDATE, DELETE
  ON sales_db.* 
  TO role_sales;

-- role_hr 只读写 hr_db
GRANT SELECT, INSERT, UPDATE, DELETE
  ON hr_db.* 
  TO role_hr;

-- role_auditor 只读所有库
GRANT SELECT 
  ON *.* 
  TO role_auditor;

10.2.2 将角色赋给用户

-- 销售部门用户
GRANT role_sales TO 'sales_user'@'%';
SET DEFAULT ROLE role_sales TO 'sales_user'@'%';

-- HR 部门用户
GRANT role_hr TO 'hr_user'@'%';
SET DEFAULT ROLE role_hr TO 'hr_user'@'%';

-- 审计用户
GRANT role_auditor TO 'auditor1'@'%';
SET DEFAULT ROLE role_auditor TO 'auditor1'@'%';

10.3 场景三：多租户隔离+管理员分级

需求：一个多租户系统，中控管理员可以看到所有租户的数据；租户管理员只可管理本租户的数据；租户用户只能访问自己对应表的数据。

10.3.1 设计角色

+----------------+       +----------------+       +----------------+
|  role_superadmin |     | role_tenant_admin |     | role_tenant_user |
+----------------+       +----------------+       +----------------+
        |                        |                         |
        |                        |                         |
        v                        v                         v
+--------------------------------+            +----------------+
|        role_common_read        |            | role_tenant_specific |
+--------------------------------+            +----------------+

role_common_read：只读全库视图、公共表、系统表。
role_tenant_admin：继承 role_common_read，并可以对本租户库进行 DDL/DML 操作。
role_tenant_user：继承 role_common_read，只可 SELECT 本租户的业务表。
role_superadmin：继承上述两个角色，并拥有全局管理权限。

10.3.2 授权示例

-- 创建基础角色
CREATE ROLE role_common_read, 
            role_tenant_admin, 
            role_tenant_user, 
            role_superadmin;

-- role_common_read：只读公共表、系统表
GRANT SELECT ON mysql.* TO role_common_read;
GRANT SELECT ON information_schema.* TO role_common_read;
GRANT SELECT ON performance_schema.* TO role_common_read;
-- … 其他公共库视图

-- role_tenant_user：继承 role_common_read，增加本租户业务表 SELECT
GRANT role_common_read TO role_tenant_user;
GRANT SELECT ON tenant1_db.* TO role_tenant_user;

-- role_tenant_admin：继承 role_tenant_user，增加对本租户库的 DML/DDL
GRANT role_tenant_user TO role_tenant_admin;
GRANT INSERT, UPDATE, DELETE, CREATE, ALTER, DROP ON tenant1_db.* TO role_tenant_admin;

-- role_superadmin：继承 role_common_read + role_tenant_admin，及全局权限
GRANT role_common_read, role_tenant_admin TO role_superadmin;
GRANT CREATE USER, GRANT OPTION, RELOAD ON *.* TO role_superadmin;

10.3.3 分配给用户

-- 租户用户
GRANT role_tenant_user TO 'tenant1_user'@'%';
SET DEFAULT ROLE role_tenant_user TO 'tenant1_user'@'%';

-- 租户管理员
GRANT role_tenant_admin TO 'tenant1_admin'@'%';
SET DEFAULT ROLE role_tenant_admin TO 'tenant1_admin'@'%';

-- 超级管理员
GRANT role_superadmin TO 'global_admin'@'%';
SET DEFAULT ROLE role_superadmin TO 'global_admin'@'%';

tenant1_user 登录后只能读 tenant1_db.*，并能读取公共库；无法做任何写操作。
tenant1_admin 登录后可以对 tenant1_db 做增删改、DDL 操作，也能读取公共库。
global_admin 登录后拥有所有租户库的管理权限（因继承了 role_tenant_admin）、以及全局用户管理权限。

11. 常见问题与注意事项

MySQL 版本兼容
- 角色功能从 MySQL 8.0.0 开始支持。若使用 5.7 或更早版本，只能使用传统用户+权限方式，不支持角色语法。
- 在代码部署时需注意目标服务器 MySQL 版本，避免使用 CREATE ROLE 等不兼容语句。
角色名与用户重名冲突
- MySQL 角色和用户共享同一命名空间，角色名不能与已存在的用户名相同，否则会报错。
- 建议为角色统一使用前缀（例如 role_），避免与实际用户名冲突。
角色的“启用状态”
- 用户不执行 SET ROLE 时，仅拥有“默认角色”或直接授予给用户的权限，其余角色暂不启用。
- 有些项目会将敏感权限分配给某些角色，再为用户不设默认角色（SET DEFAULT ROLE NONE），登录后再手动 SET ROLE 才启用，以便最小权限原则。
审计和权限变更跟踪
- 尽量通过版本化脚本来管理角色与权限变更，避免手动在生产环境乱改，保证可回滚。
- 建议定期导出 SHOW GRANTS 信息，或者通过 mysql.role_edges、mysql.user 等表进行审计，防止权限漂移。
角色层级设计需谨慎
- 角色继承链过深会导致审计和理解困难，建议最多保留两层（如 role_A → role_B → user）。
- 每个角色尽量只封装一类业务或职能，避免“万能角色”带来权限膨胀。
重置/删除角色注意
- 若要删除某个角色，务必先用 REVOKE <role> FROM ALL 将其与所有用户、角色解绑，避免出现“悬空”引用。
- 删除后，相关用户将失去该角色对应的所有权限，请提前通知并做好备份。

12. ASCII 图解：MySQL 角色权限管理全流程

以下 ASCII 图示描述了一个典型的角色权限管理流程，从角色创建、授权、到用户使用的全过程。

┌─────────────────────────────────────────────────────────────┐
│  管理员 (root 或有 CREATE ROLE 权限账号)                    │
│                                                             │
│  1. 创建角色：                                              │
│     CREATE ROLE admin, developer, readonly_user;            │
│                                                             │
│  2. 将权限授予角色：                                        │
│     GRANT ALL ON *.* TO admin;                               │
│     GRANT SELECT, INSERT, UPDATE ON business_db.* TO developer; │
│     GRANT SELECT ON business_db.* TO readonly_user;          │
│                                                             │
│  3. 配置角色层级（可选）：                                   │
│     GRANT admin TO developer;  -- developer 继承 admin 的部分权限│
│                                                             │
│  4. 将角色分配给用户：                                      │
│     CREATE USER 'alice'@'%';                                 │
│     CREATE USER 'bob'@'%';                                   │
│     GRANT developer TO 'alice'@'%';                           │
│     GRANT readonly_user TO 'bob'@'%';                         │
│                                                             │
│  5. 设置默认角色：                                          │
│     SET DEFAULT ROLE developer TO 'alice'@'%';                │
│     SET DEFAULT ROLE readonly_user TO 'bob'@'%';              │
└─────────────────────────────────────────────────────────────┘
                │                         │
                │ alice 登录               │ bob 登录
                ▼                         ▼
   ┌───────────────────────────┐   ┌───────────────────────────┐
   │ 会话 (alice @ %)          │   │ 会话 (bob @ %)            │
   │                           │   │                           │
   │ 默认角色：developer       │   │ 默认角色：readonly_user   │
   │                           │   │                           │
   │ 权限继承：                 │   │ 权限继承：                 │
   │   - SELECT,INSERT,UPDATE   │   │   - SELECT                 │
   │     ON business_db.*       │   │     ON business_db.*       │
   │   - （若开发者有继承 admin:  │   │                           │
   │      额外权限）             │   │                           │
   │                           │   │                           │
   │ 用户操作：                 │   │ 用户操作：                 │
   │   - 执行 DML、DDL 等        │   │   - 只能执行 SELECT        │
   │                           │   │                           │
   └───────────────────────────┘   └───────────────────────────┘

管理员先 创建角色，再 授权给角色，然后 为用户分配角色，最后 设置默认角色。
用户登录后，即自动拥有所分配角色的所有权限；若需要切换角色，可通过 SET ROLE 完成。

13. 常见操作小结

操作场景	SQL 示例	说明
创建角色	`CREATE ROLE rolename;`	创建一个空角色，尚无权限
删除角色	`DROP ROLE rolename;`	删除角色
查看角色权限	`SHOW GRANTS FOR rolename;`	列出角色被授予的所有权限
授予权限给角色	`GRANT SELECT, INSERT ON db.* TO rolename;`	将权限绑定到角色
撤销角色上的权限	`REVOKE DELETE ON db.* FROM rolename;`	从角色上移除指定权限
将角色授予用户	`GRANT rolename TO 'user'@'host';`	用户将继承该角色所有权限
从用户撤销角色	`REVOKE rolename FROM 'user'@'host';`	移除用户对该角色的继承
设置默认角色	`SET DEFAULT ROLE rolename TO 'user'@'host';`	用户登录后自动启用的角色
查看用户拥有的角色	`SELECT ROLE,IS_DEFAULT FROM mysql.role_edges WHERE TO_USER='user';` 或 `SELECT * FROM information_schema.enabled_roles WHERE GRANTEE="'user'@'host'";`	查询用户当前拥有的角色及默认角色信息
会话中启用/切换角色	`SET ROLE rolename;`	切换会话中启用的角色
会话中禁用所有角色	`SET ROLE NONE;`	取消会话中所有角色启用，保留用户直接赋予的权限
查询用户所有权限（含角色）	`SHOW GRANTS FOR 'user'@'host';`	列出用户直接权限与继承自角色的权限
查看角色层级关系	`SELECT * FROM mysql.role_edges;`	查看角色 ↔ 角色，角色 ↔ 用户之间的关联

14. 小结与最佳实践

统一封装权限到角色，减少重复
- 建议不要直接对普通用户做大量 GRANT，而是将常见的一组权限先封装成“角色”，再授予给用户。便于统一管理与审计。
命名规范
- 角色名统一加前缀（如 role_），避免与用户名冲突；用户账号可用业务含义命名（如 app_service, audit_user）。
最小权限原则
- 每个角色只封装执行某项任务所需的最低权限，避免过度授权。
- 针对敏感操作（如全库 DDL、用户管理），创建独立的管理员角色，仅授予给极少数超级账号。
使用默认角色与会话切换
- 对于某些高权限角色，设置为“非默认角色”，只在必要时手动启用，降低长期风险。
定期巡检与审计
- 定期执行 SHOW GRANTS FOR、查询 mysql.role_edges 等，确保权限分配符合预期，无越权用户；
- 可结合自动化脚本，将角色与用户、权限信息导出，以便存档与回溯。
版本化管理角色脚本
- 将所有涉及 CREATE ROLE、GRANT … TO role、GRANT role TO user 等脚本纳入版本控制，与应用部署流程统一管理，确保环境一致，且可随时回滚。
设计角色层级需适度
- 角色层级（Role → Role）可以简化权限组合，但层级过深或互相交叉会带来维护难度。建议最多两层继承，并保持清晰的文档说明。
注意 MySQL 版本差异
- 只有 MySQL 8.0+ 支持原生角色功能；若仍使用 MySQL 5.7 及更低版本，可通过“用户组”模拟角色（需要额外维护中间表及触发器），但较为复杂且不推荐。

通过本文，你应已全面掌握 MySQL 角色权限管理的方方面面：从创建角色、授权、分配给用户，到设置默认角色、切换角色、撤销和删除角色，以及常见的应用场景与最佳实践。合理运用角色机制，可以大幅度简化权限管理流程、提高安全性，并为未来的业务扩展提供更灵活的权限架构。

- 阅读更多 -

Sharding-JDBC详解：掌握MySQL分库分表精髓‌

System

2025-06-04

所有,mysql,中间件,数据库

Sharding-JDBC详解：掌握MySQL分库分表精髓

在互联网大规模应用场景下，单一 MySQL 实例难以承载庞大的读写压力和海量数据。Sharding-JDBC（现归入 Apache ShardingSphere）作为一款轻量级的分库分表中间件，可以在应用层面透明地实现数据库分片（Sharding），既保留了 MySQL 本身的生态优势，又能轻松应对 TB 级甚至 PB 级数据规模。本文将从原理、配置、实战到最佳实践，配合代码示例、Mermaid 图解和详细说明，帮助你快速掌握 Sharding-JDBC 的核心精髓。

什么是 Sharding-JDBC？
Sharding-JDBC 核心原理
2.1. 架构与模块层次
2.2. 分片策略（Sharding Strategy）
2.3. 路由与执行流程
基础环境与依赖准备
配置示例：Spring Boot + Sharding-JDBC
4.1. YAML 配置示例（分库分表）
4.2. Java API 方式配置示例
分库分表策略详解
5.1. 常见分片键与算法
5.2. Transaction 分布式事务支持
5.3. 读写分离（Read/Write Splitting）
数据分片路由与 SQL 拆分
6.1. 单表插入与更新如何路由
6.2. 跨分片 JOIN 和聚合
6.3. 分片键范围查询与隐藏成本
实战：项目代码示例与解释
7.1. 项目结构与依赖说明
7.2. 配置文件解读
7.3. DAO 层调用示例
7.4. 测试与验证效果
Mermaid 图解：Sharding-JDBC 工作流程
进阶话题与最佳实践
9.1. 监控与诊断（Sharding-JDBC Extra）
9.2. 动态分片扩容
9.3. 数据倾斜与热点分片优化
9.4. 分片规则演进与方案迁移
小结

1. 什么是 Sharding-JDBC？

Sharding-JDBC 是Apache ShardingSphere 中的一个组件，作为应用层的分布式数据库中间件，主要功能包括：

分库分表：将数据水平拆分到多张表或多个库，提高单表/单库压力承载能力。
读写分离：将写操作路由到主库，读操作路由到从库，实现读写分离架构。
分布式事务：基于 XA、柔性事务等多种方案，保证跨分片事务一致性。
灵活配置：支持 YAML、Spring Boot 配置、Java API 等多种配置方式，零侵入化集成应用。
生态兼容：完全兼容 JDBC 协议，对上层应用透明，无需改动原有 SQL。

与其他代理型中间件（如 MyCat、Cobar）不同，Sharding-JDBC 直接作为依赖包嵌入应用，无额外部署，易开发、易调试，还能借助 JVM 监控工具做链路跟踪。

2. Sharding-JDBC 核心原理

2.1 架构与模块层次

Sharding-JDBC 的整体架构主要分为以下几层（下图以 Mermaid 形式示意）：

flowchart LR
    subgraph 应用层 Application
        A[用户代码（DAO/Service）] 
    end

    subgraph Sharding-JDBC  (中间件依赖包)
        B1[ShardingDataSource] 
        B2[Sharding-JDBC 核心模块]
        B3[SQL解析 & 路由模块]
        B4[分片策略配置模块]
        B5[读写分离模块]
        B6[分布式事务模块]
    end

    subgraph 存储层 Storage
        C1[DB实例1 (库1)] 
        C2[DB实例2 (库2)] 
        C3[DB实例3 (库3)]
    end

    A --> |JDBC 调用| B1
    B1 --> B2
    B2 --> B3
    B3 --> B4
    B3 --> B5
    B3 --> B6
    B3 --> C1 & C2 & C3

ShardingDataSource
- 对外暴露一个 DataSource，应用直接使用该 DataSource 获取连接，无感知底层多数据库存在。
- 负责拦截并分发所有 JDBC 请求。
SQL 解析 & 路由模块
- 通过 SQLParser 将原始 SQL 解析成 AST（抽象语法树），识别出对应的分片表、分片键等信息。
- 根据配置的分片策略（Sharding Strategy）计算出目标数据节点（库 + 表），并生成路由后的 SQL 片段（如 INSERT INTO t_order_1）。
分片策略配置模块
- 包含分库（DatabaseShardingStrategy）、分表（TableShardingStrategy）、**分表自增主键（KeyGenerator）**等配置、并可定制化算法。
- 内置常见算法：标准分片（Inline）、哈希取模、范围分片、复合分片等。
读写分离模块
- 支持主从复制架构，定义主库和从库的 DataSource 集合。
- 根据 SQL 类型（SELECT、INSERT/UPDATE/DELETE）以及 Hint，可将读操作路由到从库，写操作路由到主库。
分布式事务模块
- 提供两种事务模式：XA事务（强一致性，但性能开销大）和 柔性事务（柔性事务框架，如 Seata）。
- 在多个数据源并行执行操作时，协调事务提交或回滚，保证数据一致性。

2.2 分片策略（Sharding Strategy）

常见分片策略有两种：

标准分片（Standard Sharding）
- 通过配置简单表达式（Inline）或者自定义分片算法，将分片键值映射到具体“库”与“表”。
- 例如，分片键 user_id 取模算法：
  - 数据库数量 dbCount = 2，表数量 tableCount = 4（每个库 2 张表）。
  - dbIndex = user_id % dbCount，tableIndex = user_id % tableCount。
  - 最终路由到：ds_${dbIndex}.t_user_${tableIndex}。
复合分片（Complex Sharding）
- 当一个表需要根据多个字段进行分片时，可以使用复合分片策略（Complex Sharding）。
- 例如：按 user_id 取模分库，按 order_id 取模分表。

2.3 路由与执行流程

下面用 Mermaid 时序图演示一次典型的 SQL 路由执行流程（以 INSERT 为例）：

sequenceDiagram
    participant App as 应用代码
    participant ShardingDS as ShardingDataSource
    participant SQLParser as SQLParser & Analyzer
    participant Routing as 路由模块
    participant DB1 as DB 实例1
    participant DB2 as DB 实例2

    App->>ShardingDS: connection.prepareStatement("INSERT INTO t_order(user_id, amount) VALUES (?, ?)")
    ShardingDS->>SQLParser: 解析 SQL，提取 t_order 与分片键 user_id
    SQLParser-->>Routing: 分片键 user_id = 103
    Routing->>Routing: 计算 dbIndex = 103 % 2 = 1, tableIndex = 103 % 4 = 3
    Routing-->>ShardingDS: 确定目标：ds_1.t_order_3
    ShardingDS->>DB2: 执行 "INSERT INTO t_order_3 ..."
    DB2-->>ShardingDS: 返回结果
    ShardingDS-->>App: 返回执行结果

SQLParser：负责将 SQL 文本解析成 AST，识别出分片表（t_order）和分片键（user_id）。
Routing：基于分片策略计算出目标数据节点。在本例中，user_id 为 103，ds_1 第 2 个库，t_order_3 第 4 张表。
实际执行：ShardingDS 将拼装后的 SQL 发往目标数据库节点。

3. 基础环境与依赖准备

在开始编码之前，先确保本地或服务器环境安装以下组件：

JDK 1.8+
Maven或Gradle构建工具
MySQL 多实例准备：至少两个 MySQL 实例或同机多端口模拟，数据库名可以为 ds_0、ds_1。

Apache ShardingSphere-JDBC 依赖：在 pom.xml 中引入如下核心依赖（以 5.x 版本为例）：

<dependencies>
    <!-- ShardingSphere-JDBC Spring Boot Starter -->
    <dependency>
        <groupId>org.apache.shardingsphere</groupId>
        <artifactId>shardingsphere-jdbc-spring-boot-starter</artifactId>
        <version>5.4.0</version>
    </dependency>
    <!-- MySQL 驱动 -->
    <dependency>
        <groupId>mysql</groupId>
        <artifactId>mysql-connector-java</artifactId>
        <version>8.0.33</version>
    </dependency>
    <!-- Spring Boot Web（可选，根据项目需求） -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>
    <!-- Lombok（可选，用于简化 POJO） -->
    <dependency>
        <groupId>org.projectlombok</groupId>
        <artifactId>lombok</artifactId>
        <version>1.18.28</version>
        <scope>provided</scope>
    </dependency>
</dependencies>

数据库表结构示例：在 ds_0、ds_1 中分别创建逻辑同名的分片表，例如：

-- 在 ds_0 和 ds_1 中分别执行
CREATE TABLE t_order_0 (
    order_id BIGINT AUTO_INCREMENT PRIMARY KEY,
    user_id BIGINT NOT NULL,
    amount DECIMAL(10,2) NOT NULL,
    created_time DATETIME DEFAULT CURRENT_TIMESTAMP
);
CREATE TABLE t_order_1 LIKE t_order_0;
CREATE TABLE t_order_2 LIKE t_order_0;
CREATE TABLE t_order_3 LIKE t_order_0;

这样一来，总共有四张分表：t_order_0、t_order_1（位于 ds_0），t_order_2、t_order_3（位于 ds_1）。

4. 配置示例：Spring Boot + Sharding-JDBC

Sharding-JDBC 的配置方式常见有两种：YAML/Properties 方式（最流行、最简洁）和Java API 方式。下面分别示例。

4.1 YAML 配置示例（分库分表）

在 Spring Boot 项目中，编辑 application.yml，内容示例如下：

spring:
  shardingsphere:
    datasource:
      names: ds_0, ds_1

      ds_0:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3306/ds_0?useUnicode=true&characterEncoding=utf8&serverTimezone=UTC
        username: root
        password: root

      ds_1:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3307/ds_1?useUnicode=true&characterEncoding=utf8&serverTimezone=UTC
        username: root
        password: root

    rules:
      sharding:
        tables:
          t_order:
            actual-data-nodes: ds_${0..1}.t_order_${0..3}
            database-strategy:
              inline:
                sharding-column: user_id
                algorithm-expression: ds_${user_id % 2}
            table-strategy:
              inline:
                sharding-column: user_id
                algorithm-expression: t_order_${user_id % 4}
            key-generator:
              column: order_id
              type: SNOWFLAKE
        default-database-strategy:
          none:
        default-table-strategy:
          none

说明：

datasource.names
- 定义两个 DataSource，ds_0 和 ds_1，分别对应两个物理数据库。
actual-data-nodes
- ds_${0..1}.t_order_${0..3} 表示数据节点为：
  - ds_0.t_order_0, ds_0.t_order_1, ds_0.t_order_2, ds_0.t_order_3
  - ds_1.t_order_0, ds_1.t_order_1, ds_1.t_order_2, ds_1.t_order_3
database-strategy.inline
- 分库策略：根据 user_id % 2 将数据路由到 ds_0 或 ds_1。
table-strategy.inline
- 分表策略：根据 user_id % 4 路由到对应分表。
key-generator
- 自增主键策略，使用 Snowflake 算法生成分布式唯一 order_id。

Mermaid 图解：YAML 配置对应分片结构

flowchart LR
    subgraph ds_0
        T00[t_order_0]  
        T01[t_order_1]  
        T02[t_order_2]  
        T03[t_order_3]
    end
    subgraph ds_1
        T10[t_order_0]
        T11[t_order_1]
        T12[t_order_2]
        T13[t_order_3]
    end

    %% 分库策略：user_id % 2
    A[user_id % 2 = 0] --> T00 & T01
    B[user_id % 2 = 1] --> T10 & T11
    %% 分表策略：user_id % 4
    subgraph ds_0 分表
        A --> |user_id%4=0| T00
        A --> |user_id%4=1| T01
        A --> |user_id%4=2| T02
        A --> |user_id%4=3| T03
    end
    subgraph ds_1 分表
        B --> |user_id%4=0| T10
        B --> |user_id%4=1| T11
        B --> |user_id%4=2| T12
        B --> |user_id%4=3| T13
    end

4.2 Java API 方式配置示例

如果不使用 YAML，而希望通过 Java 代码动态构建 DataSource，可如下示例：

@Configuration
public class ShardingConfig {

    @Bean
    public DataSource shardingDataSource() throws SQLException {
        // 1. 配置 ds_0
        HikariDataSource ds0 = new HikariDataSource();
        ds0.setJdbcUrl("jdbc:mysql://localhost:3306/ds_0?useUnicode=true&characterEncoding=utf8&serverTimezone=UTC");
        ds0.setUsername("root");
        ds0.setPassword("root");

        // 2. 配置 ds_1
        HikariDataSource ds1 = new HikariDataSource();
        ds1.setJdbcUrl("jdbc:mysql://localhost:3307/ds_1?useUnicode=true&characterEncoding=utf8&serverTimezone=UTC");
        ds1.setUsername("root");
        ds1.setPassword("root");

        // 3. 组装 DataSource Map
        Map<String, DataSource> dataSourceMap = new HashMap<>();
        dataSourceMap.put("ds_0", ds0);
        dataSourceMap.put("ds_1", ds1);

        // 4. 配置分片表规则
        ShardingRuleConfiguration shardingRuleConfig = new ShardingRuleConfiguration();

        TableRuleConfiguration orderTableRuleConfig = new TableRuleConfiguration();
        orderTableRuleConfig.setLogicTable("t_order");
        // ds_${0..1}.t_order_${0..3}
        orderTableRuleConfig.setActualDataNodes("ds_${0..1}.t_order_${0..3}");
        // 分库策略
        orderTableRuleConfig.setDatabaseShardingStrategyConfig(new InlineShardingStrategyConfiguration(
                "user_id", "ds_${user_id % 2}"
        ));
        // 分表策略
        orderTableRuleConfig.setTableShardingStrategyConfig(new InlineShardingStrategyConfiguration(
                "user_id", "t_order_${user_id % 4}"
        ));
        // 主键生成策略：Snowflake
        orderTableRuleConfig.setKeyGenerateStrategyConfig(new KeyGenerateStrategyConfiguration(
                "order_id", "SNOWFLAKE"
        ));

        shardingRuleConfig.getTableRuleConfigs().add(orderTableRuleConfig);

        // 5. 构造 ShardingDataSource
        return ShardingDataSourceFactory.createDataSource(
                dataSourceMap,
                shardingRuleConfig,
                new ConcurrentHashMap<>(), // shardingProperties 可留空
                new Properties()
        );
    }
}

说明：
通过 TableRuleConfiguration 定义逻辑表的映射、分库分表策略、主键生成器。
ShardingDataSourceFactory.createDataSource 根据 dataSourceMap 和 ShardingRuleConfiguration 构建 ShardingDataSource，并注册到 Spring 容器。

5. 分库分表策略详解

5.1 常见分片键与算法

选择合适的分片键至关重要，常见注意点如下：

尽量使用可以均匀分布（如 UUID、Snowflake、取模后分布较均匀的自增 ID 等）
避免热点分片：像日期、性别等值域过小、数据量集中度过高的字段，不适合作为分片键。
关联查询考量：如果业务场景需要频繁 JOIN 多张表，且能共享同一个分片键，可让它们沿用同样的分片键与算法，减少跨库 JOIN。

常见算法：

Inline（内联表达式）
- 最简单的方式，通过占位符${} 计算表达式。
- 示例：ds_${user_id % 2}，t_order_${order_id % 4}。
哈希取模（Hash）
- 通过 HashShardingAlgorithm 自定义实现，返回对应库与表。
- 适合分布更均匀、分片数量不固定的场景。
范围分片（Range）
- 通过 RangeShardingAlgorithm，将分片键值域划分成若干范围，如日期区间。
- 适用于时间分片（如按天、按月分表）。

复合分片（Complex）

在分库分表策略同时考虑多个列。例如：

complex:
  sharding-columns: user_id, order_id
  algorithm-expression: ds_${user_id % 2}.t_order_${order_id % 4}

5.2 Transaction 分布式事务支持

当业务涉及跨分片的 多表更新/插入 时，需要保障事务一致性。Sharding-JDBC 支持两种事务模式：

XA 事务（XA Transaction）
- 基于两段式提交协议（2PC），由数据库本身（如 MySQL）支持。
- 配置示例（YAML）：
```
spring:
  shardingsphere:
    rules:
      sharding:
        default-database-strategy: none
        default-table-strategy: none
        default-data-source-name: ds_0
    transaction:
      type: XA
```
- 优点：强一致性、事务隔离级别与单库事务一致。
- 缺点：性能开销较大，要求底层数据库支持 XA，且并发性能不如本地事务。
柔性事务（Base on ShardingSphere-Proxy / Saga / TCC）
- ShardingSphere 5.x 引入了柔性事务（基于 Seata 的 AT 模式或 Saga 模式）。
- 示例配置：
```
spring:
  shardingsphere:
    transaction:
      provider-type: SEATA_AT
```
- 将使用 Seata 注册中心与 TC Server 协调事务，提交速度略快于 XA。
- 需要额外部署 Seata Server 或使用 TCC/Saga 相关框架。

5.3 读写分离（Read/Write Splitting）

在分库分表之外，Sharding-JDBC 还能实现读写分离。其原理是将写操作（INSERT/UPDATE/DELETE）路由到主库，将读操作（SELECT）路由到从库。配置示例如下：

spring:
  shardingsphere:
    datasource:
      names: primary, replica0, replica1
      primary:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3306/primary_db
        username: root
        password: root
      replica0:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3307/replica_db_0
        username: root
        password: root
      replica1:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3308/replica_db_1
        username: root
        password: root

    rules:
      readwrite-splitting:
        data-sources:
          ds_group_0:
            primary-data-source-name: primary
            replica-data-source-names:
              - replica0
              - replica1
            load-balancer:
              type: ROUND_ROBIN

通过 readwrite-splitting 规则，将逻辑 ds_group_0 映射到主库 primary 和从库 replica0、replica1。
配置 load-balancer（负载均衡策略），示例使用轮询（ROUND\_ROBIN）将读请求在两台从库间分发。
应用无需修改 SQL，即可自动将 SELECT 路由到从库，其他写操作路由到主库。

6. 数据分片路由与 SQL 拆分

Sharding-JDBC 在执行 SQL 时，会对原始语句进行拆分并路由到多个数据节点。下面详细探讨几种常见场景。

6.1 单表插入与更新如何路由

以 SQL：INSERT INTO t_order(user_id, amount) VALUES (103, 99.50); 为例：

SQL 解析：识别出逻辑表 t_order、分片键字段 user_id。
计算目标分片节点：
- dsIndex = 103 % 2 = 1 → 数据库 ds_1
- tableIndex = 103 % 4 = 3 → 分表 t_order_3

生成并执行实际 SQL：

INSERT INTO ds_1.t_order_3(user_id, amount) VALUES (103, 99.50);

分片后的 PreparedStatement 只会被发送到 ds_1，其他节点无此业务执行。

6.2 跨分片 JOIN 和聚合

当业务执行以下 SQL 时，Sharding-JDBC 会尝试拆分并在本地做聚合：

SELECT u.user_id, u.name, o.order_id, o.amount
FROM t_user u
JOIN t_order o ON u.user_id = o.user_id
WHERE u.user_id BETWEEN 100 AND 200;

分片表：t_user、t_order 也按照 user_id 做同样分片。对于上述 SQL：

user_id BETWEEN 100 AND 200 对应的 dsIndex 可能为 100%2=0 到 200%2=0 → 实际会包含 ds_0、ds_1 两个库（因为用户区间跨库）。

Sharding-JDBC 会在两个数据节点各自执行对应 SQL：

-- 在 ds_0 上执行
SELECT u.user_id, u.name, o.order_id, o.amount
FROM t_user_0 u
JOIN t_order_0 o ON u.user_id=o.user_id
WHERE u.user_id BETWEEN 100 AND 200;

-- 在 ds_1 上执行
SELECT u.user_id, u.name, o.order_id, o.amount
FROM t_user_0 u
JOIN t_order_0 o ON u.user_id=o.user_id
WHERE u.user_id BETWEEN 100 AND 200;

（假设表规则为 t_user_${user_id%2}、t_order_${user_id%4}，此处简化只示意分库层面分片。）

内存合并：将两个节点返回的结果集合并（Merge），再返回给应用。

Mermaid 图解：跨库 JOIN 过程

flowchart TD
    subgraph 应用发起跨分片 JOIN
        A[SELECT ... FROM t_user JOIN t_order ... WHERE user_id BETWEEN 100 AND 200]
    end
    subgraph Sharding-JDBC 路由层
        A --> B{确定分库节点} 
        B -->|ds_0| C1[路由 ds_0: t_user_0 JOIN t_order_0 ...]
        B -->|ds_1| C2[路由 ds_1: t_user_1 JOIN t_order_1 ...]
    end
    subgraph 数据库层
        C1 --> D1[ds_0 执行 SQL]
        C2 --> D2[ds_1 执行 SQL]
        D1 --> E1[返回结果A]
        D2 --> E2[返回结果B]
    end
    E1 --> F[结果合并 & 排序]
    E2 --> F
    F --> G[最终结果返回给应用]

注意：

跨分片 JOIN 会带来性能开销，因为需要将多个节点的数据拉到应用侧或中间层进行合并。
尽量设计分片键一致的同表 JOIN，或仅在单分片范围内 JOIN，避免全局广播查询。

6.3 分片键范围查询与隐藏成本

对于 SELECT * FROM t_order WHERE user_id > 5000; 这类不带具体等值分片键的范围查询，Sharding-JDBC 只能广播到所有分片节点执行，再合并结果。隐藏成本包括：

跨库网络开销：每个库都要执行同样 SQL，返回大批结果集。
内存合并消耗：Sharding-JDBC 将多个结果集聚合到内存，需要关注 OOM 风险。

优化建议：

尽量通过业务代码指定更精确的分片键（如 AND user_id BETWEEN 1000 AND 2000 AND user_id % 2 = 0）。
使用**提示（Hint）**功能强制 SQL 只路由到特定分片。
定期归档老数据到归档库，减少主分片表数据量。

7. 实战：项目代码示例与解释

下面以一个简易 Spring Boot 项目为例，演示如何集成 Sharding-JDBC，构建订单服务，并验证分库分表效果。

7.1 项目结构与依赖说明

sharding-jdbc-demo/
├── pom.xml
└── src
    ├── main
    │   ├── java
    │   │   └── com.example.sharding
    │   │       ├── ShardingJdbcDemoApplication.java
    │   │       ├── config
    │   │       │   └── ShardingConfig.java
    │   │       ├── entity
    │   │       │   └── Order.java
    │   │       ├── mapper
    │   │       │   └── OrderMapper.java
    │   │       └── service
    │   │           └── OrderService.java
    │   └── resources
    │       └── application.yml
    └── test
        └── java
            └── com.example.sharding
                └── ShardingTest.java

ShardingJdbcDemoApplication：Spring Boot 启动类。
config/ShardingConfig：Java API 方式配置 Sharding-JDBC。
entity/Order：对应数据库分片表 t_order 的实体类。
mapper/OrderMapper：MyBatis 或 Spring JDBC Template DAO。
service/OrderService：业务服务层，提供插入、查询等方法。
application.yml：Sharding-JDBC YAML 配置示例。

7.2 配置文件解读：application.yml

server:
  port: 8080

spring:
  shardingsphere:
    datasource:
      names: ds_0, ds_1

      ds_0:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3306/ds_0
        username: root
        password: root

      ds_1:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3307/ds_1
        username: root
        password: root

    rules:
      sharding:
        tables:
          t_order:
            actual-data-nodes: ds_${0..1}.t_order_${0..3}
            database-strategy:
              inline:
                sharding-column: user_id
                algorithm-expression: ds_${user_id % 2}
            table-strategy:
              inline:
                sharding-column: user_id
                algorithm-expression: t_order_${user_id % 4}
            key-generator:
              column: order_id
              type: SNOWFLAKE

与前文示例一致，指定两个数据源与分片表规则。
t_order 分片表规则写明了 actual-data-nodes、分片策略和 Snowflake 主键生成器。

7.3 DAO 层调用示例：OrderMapper

假设使用 MyBatis，OrderMapper.java 如下：

package com.example.sharding.mapper;

import com.example.sharding.entity.Order;
import org.apache.ibatis.annotations.*;

import java.util.List;

@Mapper
public interface OrderMapper {

    @Insert("INSERT INTO t_order(user_id, amount) VALUES (#{userId}, #{amount})")
    @Options(useGeneratedKeys = true, keyProperty = "orderId")
    int insertOrder(Order order);

    @Select("SELECT order_id, user_id, amount, created_time FROM t_order WHERE user_id = #{userId}")
    List<Order> selectByUserId(@Param("userId") Long userId);

    @Select("SELECT order_id, user_id, amount, created_time FROM t_order WHERE order_id = #{orderId}")
    Order selectByOrderId(@Param("orderId") Long orderId);
}

说明：
insertOrder 不需要关心分片，Sharding-JDBC 会自动将其路由到正确分表并填充主键 orderId。
查询 selectByUserId 会根据分片策略，将 SQL 路由到相应的分表，返回单个分片中的结果集合。
selectByOrderId 若 orderId 作为分片键或暴露了分片信息，可更准确地路由到单表，否则会广播到所有分片，合并后返回。

7.4 Service 层示例：OrderService

package com.example.sharding.service;

import com.example.sharding.entity.Order;
import com.example.sharding.mapper.OrderMapper;
import org.springframework.stereotype.Service;
import org.springframework.transaction.annotation.Transactional;

import java.util.List;

@Service
public class OrderService {

    private final OrderMapper orderMapper;

    public OrderService(OrderMapper orderMapper) {
        this.orderMapper = orderMapper;
    }

    /**
     * 创建订单
     */
    @Transactional
    public Long createOrder(Long userId, Double amount) {
        Order order = new Order();
        order.setUserId(userId);
        order.setAmount(amount);
        orderMapper.insertOrder(order);
        return order.getOrderId();
    }

    /**
     * 根据 user_id 查询该用户所有订单
     */
    public List<Order> getOrdersByUser(Long userId) {
        return orderMapper.selectByUserId(userId);
    }

    /**
     * 根据 order_id 查询订单
     */
    public Order getOrderById(Long orderId) {
        return orderMapper.selectByOrderId(orderId);
    }
}

@Transactional 保证跨分片的单个插入操作也在同一事务上下文中。
获取订单列表（getOrdersByUser）会被 Sharding-JDBC 路由到当前 userId 所在的分片。
若 getOrderById 方法中使用的 orderId 可用来反推出 userId（例如存储了 userId 或在业务层先查询出 userId），则可避免广播查询。

7.5 测试与验证效果：ShardingTest

使用 JUnit 简要验证分库分表效果：

@SpringBootTest
public class ShardingTest {

    @Autowired
    private OrderService orderService;

    @Test
    public void testShardingInsertAndQuery() {
        // 插入不同 userId 的订单
        Long orderId1 = orderService.createOrder(1001L, 50.0);
        Long orderId2 = orderService.createOrder(1002L, 75.0);
        Long orderId3 = orderService.createOrder(1003L, 120.0);

        System.out.println("orderId1 = " + orderId1);
        System.out.println("orderId2 = " + orderId2);
        System.out.println("orderId3 = " + orderId3);

        // 查询 userId=1001 的订单（应路由到 ds_1.t_order_1）
        List<Order> orders1001 = orderService.getOrdersByUser(1001L);
        Assertions.assertFalse(orders1001.isEmpty());

        // 查询 orderId1
        Order o1 = orderService.getOrderById(orderId1);
        Assertions.assertNotNull(o1);
        System.out.println("Fetched Order: " + o1);
    }
}

验证要点：
通过插入多条订单，先查看日志或调试断点，确认 INSERT 路由到不同分片表。
调用 getOrdersByUser 时，Sharding-JDBC 会计算 userId%2 与 userId%4，定位到正确分片。
调用 getOrderById（如果未设置分片键查询），会广播到所有分片，效率略低，应在业务层优化。

8. Mermaid 图解：Sharding-JDBC 工作流程

下面通过 Mermaid 时序图和流程图更加直观地展示 Sharding-JDBC 的工作过程。

8.1 单条插入请求全过程

sequenceDiagram
    participant App as 应用代码
    participant ShardingDS as ShardingDataSource
    participant Parser as SQLParser
    participant Routing as 路由模块
    participant Execute as 执行模块
    participant DB0 as ds_0
    participant DB1 as ds_1

    App->>ShardingDS: getConnection()
    ShardingDS-->>App: Connection

    App->>ShardingDS: prepareStatement("INSERT INTO t_order(user_id, amount) VALUES (101, 59.99)")
    ShardingDS->>Parser: 解析 SQL -> 抽象语法树 (AST)
    Parser-->>Routing: 提取 t_order, sharding_column=user_id=101
    Routing->>Routing: 101 % 2 => 1；101 % 4 => 1
    Routing-->>Execute: 路由到 ds_1.t_order_1
    Execute->>DB1: 执行 "INSERT ds_1.t_order_1(user_id, amount) VALUES (101, 59.99)"
    DB1-->>Execute: 返回执行结果（主键 auto-generated）
    Execute-->>App: 返回执行结果

8.2 读写分离 SQL 路由

flowchart LR
    subgraph 应用 SQL
        A1[SELECT * FROM t_order WHERE order_id = 123] 
        A2[INSERT INTO t_order(…) VALUES (…) ]
    end

    subgraph Sharding-JDBC 路由
        A1 --> B1{读 or 写?}
        B1 -- 读 --> C1[路由到从库 (replica)]
        B1 -- 写 --> C2[路由到主库 (primary)]
        C1 --> DB_read
        C2 --> DB_write
    end

Sharding-JDBC 根据 SQL 类型自动判断读写，将读操作发到从库，写操作发到主库。

9. 进阶话题与最佳实践

9.1 监控与诊断（Sharding-JDBC Extra）

利用 Sharding Analytics 运维工具，可实时查看各分片节点的 QPS、TPS、慢 SQL、热点表等信息。
性能插件：可以通过 Sharding-JDBC 的拦截器或 AOP 插件打印每条 SQL 的路由详情、执行耗时，辅助定位瓶颈。
对于关键 SQL，建议开启SQL 转换开关（SQLShow 或 SQLPrint）以记录实际路由后的真实 SQL，便于调试。

9.2 动态分片扩容

9.2.1 扩容思路

水平扩容数据库实例：新增一个或多个数据库，用于接收新数据分片。
更新分片规则：修改 actual-data-nodes，将新增的数据库纳入分片节点范围。
迁移旧数据：通过脚本或工具，将历史数据从旧节点迁移到新节点，并调整分片键映射（如更新模运算参数）。
灰度切换 & 测试：逐步上线新版分片规则，观察系统情况，最后彻底切换、下线旧分片。

9.2.2 实现示例

假设需要在两个分库基础上新增 ds_2，原分片公式 user_id % 3，分表 user_id % 6。配置变化示例如下：

spring:
  shardingsphere:
    datasource:
      names: ds_0, ds_1, ds_2

      ds_2:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3309/ds_2
        username: root
        password: root

    rules:
      sharding:
        tables:
          t_order:
            actual-data-nodes: ds_${0..2}.t_order_${0..5}
            database-strategy:
              inline:
                sharding-column: user_id
                algorithm-expression: ds_${user_id % 3}
            table-strategy:
              inline:
                sharding-column: user_id
                algorithm-expression: t_order_${user_id % 6}
            key-generator:
              column: order_id
              type: SNOWFLAKE

旧配置：user_id % 2 → 2 库，user_id % 4 → 4 表。
新配置：user_id % 3 → 3 库，user_id % 6 → 6 表。
在 平滑灰度 期间，需要双写到新旧分片（或仅写旧分片、暂缓读取），并逐步迁移历史数据。

9.3 数据倾斜与热点分片优化

诊断：通过监控 QPS、TPS、慢 SQL 等指标，发现某些分片负载明显高于其他。
避免：选取合适分片键，保证数据均匀分布；如使用哈希后缀替代直接自增。
手动干预：对于热点数据，可考虑手动分表、热点拆分（Hot partitioning）或者在应用层进行短暂缓存，降低分片压力。

9.4 分片规则演进与方案迁移

提前设计：最好预估未来数据规模，提前留出足够分片余量，避免频繁变更分片键算法。
弱化分片键依赖：在业务层不要过度依赖隐式分片逻辑，比如不要在业务代码大量写死 ds_${user_id % n}，而应借助 Sharding-JDBC 来管理路由。
物理表名与逻辑表名解耦：不要在应用中直接使用物理分片表名；始终以逻辑表名（t_order）作为编程接口，让 Sharding-JDBC 透明转发。

10. 小结

本文围绕 “Sharding-JDBC详解：掌握MySQL分库分表精髓” 这一主题，从以下几个角度展开了详尽介绍：

Sharding-JDBC 的定位与核心原理
- 作为应用层轻量级分布式中间件，无需额外部署，兼容 JDBC 生态。
- 内部模块划分：DataSource 拦截、SQL 解析与路由、分片策略、读写分离、分布式事务等。
YAML 与 Java API 配置示例
- 详细展示了如何在 Spring Boot 中通过 YAML 或 Java 代码动态配置 DataSource、分片规则、Snowflake 主键生成器等。
- 通过 Mermaid 图解辅助说明分片表、分库策略如何映射到实际物理节点。
分片策略与路由执行流程
- 介绍了标准分片（Inline、Hash）、复合分片、范围分片等策略。
- 剖析了 SQLRouter 如何将原始 SQL 拆解、路由到目标数据节点，并在应用层进行结果合并。
常见问题与优化实践
- 提示跨分片 JOIN、范围查询带来的性能成本，建议尽量限定分片键查询范围。
- 探讨了分布式事务模式（XA、柔性事务）、读写分离、监控诊断、动态扩容、数据倾斜等进阶话题。
完整项目实战示例
- 提供一个可运行的 Spring Boot 示例，演示如何定义 DAO、Service、配置、单元测试，快速验证 Sharding-JDBC 分库分表功能。
- 通过 JUnit 测试展示插入、按 user_id 查询等常见业务场景。
未来演进与最佳实践
- 强调分片键选择对系统均衡性的重要性；
- 建议提前预留分片策略，减少后期迁移成本；
- 提供分片规则变更、数据迁移、灰度发布等常见方案思路。

掌握了 Sharding-JDBC 的核心精髓后，你将能够在不改动应用层业务代码的前提下，轻松实现 MySQL 的分库分表、读写分离与分布式事务，支撑大规模高并发场景。希望本文的代码示例、图解和详细说明能帮助你快速上手、并在实际项目中得心应手地应用 Sharding-JDBC 解决方案。

- 阅读更多 -

MyBatis Plus自动映射失败深度解析：解决数据库表与实体类不匹配问题‌

System

2025-06-02

所有,分布式,java,数据库

MyBatis Plus自动映射失败深度解析：解决数据库表与实体类不匹配问题

在使用 MyBatis Plus 进行数据访问时，往往可以借助其“自动映射”功能，省去大量手动编写 ResultMap 或 @Result 的工作。但在实际开发中，我们常常会遇到“实体类与数据库表字段不完全匹配，导致自动映射失败”的尴尬场景。本文将从原理出发，结合代码示例和图解，详细讲解导致映射失败的常见原因，并给出相应的解决方案。通过阅读，你将系统地理解 MyBatis Plus 的映射规则，学会快速定位与修复实体类与表结构不匹配的问题。

MyBatis Plus 自动映射原理概述
常见导致自动映射失败的原因
2.1. 命名策略不一致（下划线 vs 驼峰）
2.2. 实体字段与表字段类型不匹配
2.3. 字段缺失或多余
2.4. 未配置或配置错误的注解
2.5. 全局配置干扰
案例一：下划线字段与驼峰属性映射失败分析
3.1. 问题再现：表结构 & 实体代码
3.2. MyBatis Plus 默认命名策略
3.3. 失败原因图解与日志分析
3.4. 解决方案：开启驼峰映射或手动指定字段映射
案例二：字段类型不兼容导致映射失败
4.1. 问题再现：表中 tinyint(1) 对应 Boolean
4.2. MyBatis Plus TypeHandler 原理
4.3. 解决方案：自定义或使用内置 TypeHandler
案例三：注解配置不当导致主键识别失败
5.1. 问题再现：@TableId 配置错误或遗漏
5.2. MyBatis Plus 主键策略识别流程
5.3. 解决方案：正确使用 @TableId、@TableName、@TableField
全局配置与自动映射的配合优化
6.1. 全局启用驼峰映射
6.2. 全局字段前缀/后缀过滤
6.3. Mapper XML 与注解映射的配合
工具与调试技巧
7.1. 查看 SQL 日志与返回列
7.2. 使用 @TableField(exist = false) 忽略非表字段
7.3. 利用 IDE 快速生成映射代码
总结与最佳实践

1. MyBatis Plus 自动映射原理概述

MyBatis Plus 在执行查询时，会根据返回结果的列名（ResultSetMetaData 中的列名）与实体类的属性名进行匹配。例如，数据库表有列 user_name，实体类有属性 userName，如果开启了驼峰映射（map-underscore-to-camel-case = true），则 MyBatis Plus 会将 user_name 转换为 userName 并注入到实体中。其基本流程如下：

┌───────────────────────────────┐
│       执行 SQL 查询            │
└───────────────┬───────────────┘
                │
                ▼
┌───────────────────────────────┐
│ JDBC 返回 ResultSet (列名：C)  │
└───────────────┬───────────────┘
                │
                ▼
┌───────────────────────────────┐
│ MyBatis Plus 读取列名 (C)      │
│  1. 若驼峰映射开启：            │
│     将 “下划线” 转换为驼峰       │
│  2. 找到与实体属性 (P) 对应的映射 │
└───────────────┬───────────────┘
                │
                ▼
┌───────────────────────────────┐
│ 调用 Setter 方法，将值注入到 P│
└───────────────────────────────┘

若 C 与 P 无法匹配，MyBatis Plus 就不会调用对应的 Setter，导致该属性值为 null 或默认值。本文将围绕这个匹配过程，深入分析常见问题及解决思路。

2. 常见导致自动映射失败的原因

下面列举常见的几类问题及简要描述：

2.1 命名策略不一致（下划线 vs 驼峰）

表字段 使用 user_name，而实体属性 为 username 或 userName。
未开启 map-underscore-to-camel-case 驼峰映射，导致 user_name 无法匹配 userName。
开启驼峰映射 却在注解上自定义了不同的列名，导致规则冲突。

2.2 实体字段与表字段类型不匹配

SQL 类型：如表中字段是 tinyint(1)，实体属性是 Boolean；MyBatis 默认可能将其映射为 Byte 或 Integer。
大数类型：bigint 对应到 Java 中可能为了精度使用 Long 或 BigInteger，却在实体中写成了 Integer。
枚举类型：数据库存储字符串 “MALE / FEMALE”，实体枚举类型不匹配，导致赋值失败。

2.3 字段缺失或多余

表删除或在新增字段后，忘记在实体类中添加对应属性，导致查询时列未能映射到实体。
实体存在非表字段：需要用 @TableField(exist = false) 忽略，否则映射引擎会报错找不到列。

2.4 未配置或配置错误的注解

@TableName：如果实体类与表名不一致，未使用 @TableName("real_table") 指定真实表名。
@TableField(value = "xxx")：当字段名与实体属性不一致时，需要手动指定，否则自动策略无法匹配。
@TableId：主键映射或 ID 策略配置不正确，导致插入或更新异常。

2.5 全局配置干扰

全局驼峰映射关闭：application.yml 中未开启 mybatis-plus.configuration.map-underscore-to-camel-case=true。
字段前缀/后缀过滤：全局配置了 tableFieldUnderline 或 columnLabelUpper 等参数，影响映射规则。

3. 案例一：下划线字段与驼峰属性映射失败分析

3.1 问题再现：表结构 & 实体代码

假设数据库中有如下表 user_info：

CREATE TABLE user_info (
  id BIGINT PRIMARY KEY AUTO_INCREMENT,
  user_name VARCHAR(50),
  user_age INT,
  create_time DATETIME
);

而对应的实体类 UserInfo 写为：

package com.example.demo.entity;

import com.baomidou.mybatisplus.annotation.TableId;
import com.baomidou.mybatisplus.annotation.TableName;
import java.time.LocalDateTime;

@TableName("user_info")
public class UserInfo {
    @TableId
    private Long id;

    private String userName;
    private Integer userAge;

    // 忘记添加 createTime 字段
    // private LocalDateTime createTime;

    // getters & setters
    public Long getId() { return id; }
    public void setId(Long id) { this.id = id; }

    public String getUserName() { return userName; }
    public void setUserName(String userName) { this.userName = userName; }

    public Integer getUserAge() { return userAge; }
    public void setUserAge(Integer userAge) { this.userAge = userAge; }
}

此时我们执行查询：

import com.example.demo.entity.UserInfo;
import com.example.demo.mapper.UserInfoMapper;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;
import java.util.List;

@Service
public class UserService {
    @Autowired
    private UserInfoMapper userInfoMapper;

    public List<UserInfo> listAll() {
        return userInfoMapper.selectList(null);
    }
}

预期：userName 对应 user_name，userAge 对应 user_age，并将 create_time 映射到一个属性。
实际结果：userName、userAge 的值正常，但 createTime 未定义在实体中，MyBatis Plus 将忽略该列；如果驼峰映射未开启，甚至 userName、userAge 都会是 null。

3.2 MyBatis Plus 默认命名策略

MyBatis Plus 默认使用的命名策略（NamingStrategy.underline_to_camel）会对列名进行下划线转驼峰。但前提条件是在全局配置中或注解中启用该转换：

# application.yml
mybatis-plus:
  configuration:
    # 开启下划线转驼峰映射（驼峰命名）
    map-underscore-to-camel-case: true

如果未配置上面的项，MyBatis Plus 不会对列名做任何转换，从而无法将 user_name 映射到 userName。

3.3 失败原因图解与日志分析

┌───────────────────────────────┐
│       查询结果列列表           │
│  [id, user_name, user_age,    │
│   create_time]                │
└───────────────┬───────────────┘
                │
                ▼
┌───────────────────────────────┐
│ MyBatis Plus自动映射引擎      │
│  1. 读取列名 user_name         │
│  2. 未开启驼峰映射，保持原样   │
│  3. 在实体 UserInfo 中查找属性  │
│     getUser_name() 或 user_name │
│  4. 找不到，跳过该列           │
│  5. 下一个列 user_age 类似处理   │
└───────────────┬───────────────┘
                │
                ▼
┌───────────────────────────────┐
│ 映射结果：                     │
│  id=1, userName=null,         │
│  userAge=null,                │
│  (create_time 忽略)           │
└───────────────────────────────┘

日志示例（Spring Boot 启用 SQL 日志级别为 DEBUG）：

DEBUG com.baomidou.mybatisplus.core.MybatisConfiguration - MappedStatement(id=... selectList, ...) does not have property: user_name
DEBUG com.baomidou.mybatisplus.core.MybatisConfiguration - MappedStatement(id=... selectList, ...) does not have property: user_age
DEBUG com.baomidou.mybatisplus.core.MybatisConfiguration - MappedStatement(id=... selectList, ...) does not have property: create_time

3.4 解决方案：开启驼峰映射或手动指定字段映射

3.4.1 方案1：全局开启驼峰映射

在 application.yml 中加入：

mybatis-plus:
  configuration:
    map-underscore-to-camel-case: true

此时，MyBatis Plus 会执行下划线 → 驼峰转换，user_name → userName。同时，需要在实体中增加 createTime 字段：

private LocalDateTime createTime;

public LocalDateTime getCreateTime() { return createTime; }
public void setCreateTime(LocalDateTime createTime) { this.createTime = createTime; }

3.4.2 方案2：手动指定字段映射

如果不想全局启用驼峰映射，也可在实体类中针对每个字段使用 @TableField 显式指定列名：

@TableName("user_info")
public class UserInfo {
    @TableId
    private Long id;

    @TableField("user_name")
    private String userName;

    @TableField("user_age")
    private Integer userAge;

    @TableField("create_time")
    private LocalDateTime createTime;

    // getters & setters...
}

此时就不依赖全局命名策略，而是用注解进行精确匹配。

4. 案例二：字段类型不兼容导致映射失败

4.1 问题再现：表中 `tinyint(1)` 对应 `Boolean`

在 MySQL 数量中，常常使用 tinyint(1) 存储布尔值，例如：

CREATE TABLE product (
  id BIGINT PRIMARY KEY AUTO_INCREMENT,
  name VARCHAR(100),
  is_active TINYINT(1)  -- 0/1 存布尔
);

如果在实体类中直接写成 private Boolean isActive;，MyBatis Plus 默认会尝试将 tinyint(1) 映射成 Integer 或 Byte，而无法自动转换为 Boolean，导致字段值为 null 或抛出类型转换异常。

4.2 MyBatis Plus TypeHandler 原理

MyBatis Plus 使用 MyBatis 底层的 TypeHandler 机制来完成 JDBC 类型与 Java 类型之间的转换。常见的内置 Handler 包括：

IntegerTypeHandler：将整数列映射到 Integer。
LongTypeHandler：将 BIGINT 映射到 Long。
BooleanTypeHandler：将 JDBC BIT / BOOLEAN 映射到 Java Boolean。
ByteTypeHandler、ShortTypeHandler 等。

MyBatis Plus 默认注册了部分常用 TypeHandler，但对 tinyint(1) → Boolean 并不默认支持（MySQL 驱动会将 tinyint(1) 视为 Boolean，但在不同版本或不同配置下可能不生效）。所以需要显式指定或自定义 Handler。

4.3 解决方案：自定义或使用内置 TypeHandler

4.3.1 方案1：手动指定 `@TableField` 的 `typeHandler`

import org.apache.ibatis.type.JdbcType;
import org.apache.ibatis.type.BooleanTypeHandler;
import com.baomidou.mybatisplus.annotation.TableField;
import com.baomidou.mybatisplus.annotation.TableId;
import com.baomidou.mybatisplus.annotation.TableName;

@TableName("product")
public class Product {
    @TableId
    private Long id;

    private String name;

    @TableField(value = "is_active", jdbcType = JdbcType.TINYINT, typeHandler = BooleanTypeHandler.class)
    private Boolean isActive;

    // getters & setters...
}

jdbcType = JdbcType.TINYINT：告知 MyBatis 列类型为 TINYINT。
typeHandler = BooleanTypeHandler.class：使用 MyBatis 内置的 BooleanTypeHandler，将 0/1 转换为 false/true。

4.3.2 方案2：全局注册自定义 TypeHandler

如果项目中有大量 tinyint(1) → Boolean 的转换需求，可以在全局配置中加入自定义 Handler。例如，创建一个 TinyintToBooleanTypeHandler：

import org.apache.ibatis.type.BaseTypeHandler;
import org.apache.ibatis.type.JdbcType;
import java.sql.*;

public class TinyintToBooleanTypeHandler extends BaseTypeHandler<Boolean> {
    @Override
    public void setNonNullParameter(PreparedStatement ps, int i, Boolean parameter, JdbcType jdbcType) throws SQLException {
        ps.setInt(i, parameter ? 1 : 0);
    }

    @Override
    public Boolean getNullableResult(ResultSet rs, String columnName) throws SQLException {
        int value = rs.getInt(columnName);
        return value != 0;
    }

    @Override
    public Boolean getNullableResult(ResultSet rs, int columnIndex) throws SQLException {
        int value = rs.getInt(columnIndex);
        return value != 0;
    }

    @Override
    public Boolean getNullableResult(CallableStatement cs, int columnIndex) throws SQLException {
        int value = cs.getInt(columnIndex);
        return value != 0;
    }
}

然后在 MyBatis 配置中全局注册：

mybatis-plus:
  configuration:
    type-handlers-package: com.example.demo.typehandler

这样，当 MyBatis Plus 扫描到该包下的 TinyintToBooleanTypeHandler，并结合对应的 jdbcType，会自动触发映射。

5. 案例三：注解配置不当导致主键识别失败

5.1 问题再现：`@TableId` 配置错误或遗漏

假如有如下表 order_info，主键为 order_id，且采用自增策略：

CREATE TABLE order_info (
  order_id BIGINT PRIMARY KEY AUTO_INCREMENT,
  user_id BIGINT,
  total_price DECIMAL(10,2)
);

而实体类定义为：

@TableName("order_info")
public class OrderInfo {
    // 少写了 @TableId
    private Long orderId;

    private Long userId;
    private BigDecimal totalPrice;

    // getters & setters...
}

问题：MyBatis Plus 无法识别主键，默认会根据 id 字段查找或使用全表查询，然后更新/插入策略混乱。
后果：插入时无法拿到自增主键，执行 updateById 会出现 WHERE id = ? 却找不到对应列，导致 SQL 异常或无效。

5.2 MyBatis Plus 主键策略识别流程

MyBatis Plus 在执行插入操作时，如果实体类中没有明确指定 @TableId，会：

尝试查找：判断实体类中是否有属性名为 id 的字段，并将其视作主键。
若无，就无法正确拿到自增主键，会导致 INSERT 后无主键返回，或使用雪花 ID 策略（如果全局配置了）。

在更新时，如果 @TableId 未配置，会尝试从实体的 id 属性获取主键值，导致找不到列名 id 报错。

5.3 解决方案：正确使用 `@TableId`、`@TableName`、`@TableField`

正确的实体应该写成：

package com.example.demo.entity;

import com.baomidou.mybatisplus.annotation.IdType;
import com.baomidou.mybatisplus.annotation.TableId;
import com.baomidou.mybatisplus.annotation.TableName;
import java.math.BigDecimal;

@TableName("order_info")
public class OrderInfo {

    @TableId(value = "order_id", type = IdType.AUTO)
    private Long orderId;

    private Long userId;
    private BigDecimal totalPrice;

    // getters & setters...
}

@TableId(value = "order_id", type = IdType.AUTO)：
- value = "order_id"：指定实际的表主键列名；
- type = IdType.AUTO：使用数据库自增策略。

如果实体属性名与列名不一致，需使用 @TableField 指定：

@TableField("total_price")
private BigDecimal totalPrice;

6. 全局配置与自动映射的配合优化

在实际项目中，各种小错误可能会互相干扰。下面介绍一些常用的全局配置与优化方案。

6.1 全局启用驼峰映射

在 application.yml 中添加：

mybatis-plus:
  configuration:
    map-underscore-to-camel-case: true

效果： 所有查询结果列名如 create_time、user_name 都会自动映射到实体属性 createTime、userName。

6.2 全局字段前缀/后缀过滤

如果表中有公共字段前缀（如 tb_user_name）而实体属性不加前缀，可以在注解或全局策略中进行过滤。例如：

mybatis-plus:
  global-config:
    db-config:
      table-prefix: tb_   # 全局去除表名前缀
      field-strategy: not_empty

6.3 Mapper XML 与注解映射的配合

有时自动映射无法满足复杂场景，可结合 XML 手动编写 ResultMap：

<resultMap id="UserInfoMap" type="com.example.demo.entity.UserInfo">
    <id property="id" column="id" />
    <result property="userName" column="user_name" />
    <result property="userAge" column="user_age" />
    <result property="createTime" column="create_time" />
</resultMap>

<select id="selectAll" resultMap="UserInfoMap">
    SELECT id, user_name, user_age, create_time FROM user_info
</select>

在 Mapper 接口中调用 selectAll() 即可准确映射：

List<UserInfo> selectAll();

7. 工具与调试技巧

以下技巧可帮助你快速定位映射失败的问题：

7.1 查看 SQL 日志与返回列

在 application.yml 中开启 MyBatis Plus SQL 日志：

logging:
  level:
    com.baomidou.mybatisplus: debug
    org.apache.ibatis: debug

启动后，在控制台可以看到：

最终执行的 SQL：帮助确认查询语句。
返回列名：MyBatis 会打印 “不匹配的列” 信息，如 does not have property: user_name，可据此定位实体与列不一致处。

7.2 使用 `@TableField(exist = false)` 忽略非表字段

如果实体类中包含业务特有字段，不对应数据库列，可在属性上加上：

@TableField(exist = false)
private String transientField;

这样 MyBatis Plus 在映射时会忽略该属性，不会报错找不到对应列。

7.3 利用 IDE 快速生成映射代码

工具如 IntelliJ IDEA 的 MyBatis Plus 插件或 MyBatis Generator 可以根据数据库表结构自动生成实体、Mapper 接口和 XML 文件，减少手写注解或 ResultMap 的工作量。

8. 总结与最佳实践

通过本文的分析与多个案例演示，我们可以总结如下最佳实践，以避免或快速定位 MyBatis Plus 自动映射失败的问题：

统一命名规范
- 数据库表字段使用下划线分隔，Java 实体属性使用驼峰命名，并开启全局驼峰映射 map-underscore-to-camel-case=true。
- 若命名风格特殊，务必在实体上使用 @TableField(value = "...") 指定对应列名。
主键与表名注解
- 对于实体与表名不一致的情况，必须显式加上 @TableName("real_table_name")。
- 对于主键字段，务必使用 @TableId(value="col", type=IdType.XXX) 正确指定列名与主键策略。
TypeHandler 匹配
- 注意数据库字段类型与实体属性类型的匹配，特别是布尔字段、时间类型、JSON 类型等。
- 如有需要，自定义或指定合适的 TypeHandler 进行转换。
忽略无关字段
- 实体中非数据库列字段必须加 @TableField(exist = false)，避免映射引擎抛出“找不到对应列”的错误。
日志调试
- 开启 MyBatis Plus 与 MyBatis 的 DEBUG 日志，查看不匹配列和映射过程，有助于快速定位问题。
组合使用 XML 与注解
- 对于过于复杂的查询或特殊映射，可借助 XML 自定义 ResultMap，手动指定列到属性的映射关系。
保持表结构与实体同步
- 开发过程中尽量采用代码生成工具或严格的同步流程，避免表字段变更后忘记更新实体，造成映射失败。

通过遵循上述原则，并灵活运用 MyBatis Plus 提供的注解与配置，你可以快速解决大多数“自动映射失败”的问题，最大程度上发挥 MyBatis Plus 自动化特性，提升开发效率。

- 阅读更多 -

ClickHouse分布式部署、表创建及数据迁移全攻略‌

System

2025-06-02

所有,分布式,数据库

ClickHouse分布式部署、表创建及数据迁移全攻略

在大数据时代，ClickHouse 以其高性能 OLAP 查询能力和良好的水平扩展性，逐渐成为海量时序与分析场景的首选数据库。要将 ClickHouse 用于生产环境，往往需要部署分布式集群，实现数据的分片与复制，并针对业务场景设计分布式表结构与数据迁移策略。本文将从分布式架构原理出发，结合代码示例与图解，全面介绍如何完成 ClickHouse 分布式集群的部署、表的创建（含复制表与分布式表）、以及数据迁移的多种手段，帮助你快速掌握 ClickHouse 在生产环境的使用要点。

ClickHouse 分布式架构概述
1.1. 单节点 vs 分布式
1.2. 分片（Shard）与副本（Replica）
1.3. ZooKeeper 在分布式中的作用
环境准备与组件安装
2.1. 系统与网络要求
2.2. 安装 ZooKeeper 集群
2.3. 安装 ClickHouse 节点
分布式集群部署示例
3.1. 集群拓扑设计与图解
3.2. ZooKeeper 配置
3.3. ClickHouse config.xml 与 users.xml 配置
3.4. 启动 ClickHouse 服务与校验
分布式表引擎与表创建
4.1. MergeTree 与 ReplicatedMergeTree 引擎
4.2. Distributed 引擎原理与实现
4.3. 本地表与分布式表创建示例
4.4. 示例：查询分布式表的执行流程图解
数据写入、查询与负载均衡
5.1. 写入到 ReplicatedMergeTree 且分片自动路由
5.2. 分布式表查询流程详解
5.3. Insert、Select 示例
数据迁移与同步策略
6.1. 单机 ClickHouse 到分布式集群迁移
6.2. MySQL 到 ClickHouse 的迁移示例（使用 Kafka 或 clickhouse-mysql）
6.3. clickhouse-copier 工具使用
6.4. INSERT SELECT 与外部表引擎同步
6.5. 实时同步示例：使用 Kafka 引擎 + Materialized View
运维与监控要点
7.1. ZooKeeper 集群监控
7.2. ClickHouse 节点健康检查
7.3. 分片与副本恢复流程
7.4. 备份与恢复策略
常见问题与优化建议
8.1. 查询慢或分布式 JOIN 性能优化
8.2. 数据倾斜与分片键设计
8.3. 磁盘、内存、网络调优
总结

1. ClickHouse 分布式架构概述

在深入部署细节之前，首先要明确 ClickHouse 在分布式场景下的几大核心概念：分片（Shard）、副本（Replica）、ZooKeeper 元数据管理，以及分布式表（Distributed Engine）与本地表（MergeTree/ReplicatedMergeTree）的配合。

1.1 单节点 vs 分布式

单节点部署
- 典型用于测试、小规模数据或单机分析。
- 数据存储在本地 MergeTree 或其派生引擎（如 SummingMergeTree、AggregatingMergeTree 等）表中。
- 缺点：无法横向扩展，无副本冗余，节点宕机即数据不可用。
分布式部署
- 通过将数据按某种分片策略均匀分布到多个实例（Shard）上，同时为每个 Shard 配置副本（Replica），实现高可用与水平扩展。
- 查询时，客户端可通过分布式表路由到对应 Shard，或跨 Shard 聚合查询。
- 核心组件：
  - ClickHouse 节点：负责存储与执行。
  - ZooKeeper：负责存储分布式元数据（表的分片 & 副本信息、DDL 同步）。

1.2 分片（Shard）与副本（Replica）

Shard（分片）
- 将逻辑数据集按分片键（如用户 ID、时间范围或哈希值）均匀切分为多个子集，每个子集部署在不同的节点上。
- 常见策略：
  - Hash 分片：shard_key = cityHash64(user_id) % shard_count。
  - 范围分片：根据时间/业务范围拆分。
Replica（副本）
- 每个 Shard 下可部署多个 Replica，保证 Shard 内数据的一致性与高可用。
- Replica 间基于 ZooKeeper 的复制队列自动同步数据。
- 在一个 Replica 挂掉时，点击恢复或重启，其他 Replica 可继续提供服务。

图解：多 Shard / 多 Replica 架构示例

               ┌────────────────────────────────────────────────┐
               │               ZooKeeper 集群（3 节点）          │
               │  存储：/clickhouse/tables/{db}.{table}/shardN   │
               └────────────────────────────────────────────────┘
                      │                   │               │
     ┌────────────────┴─────┐     ┌─────────┴────────┐      │
     │ Shard 1              │     │ Shard 2           │      │
     │ ┌─────────┐ ┌───────┐ │     │ ┌─────────┐ ┌──────┐ │      │
     │ │Replica1 │ │Replica2│ │     │ │Replica1 │ │Replica2│ │      │
     │ │ Node A  │ │ Node B │ │     │ │ Node C  │ │ Node D │ │      │
     │ └─────────┘ └───────┘ │     │ └─────────┘ └──────┘ │      │
     └───────────────────────┘     └─────────────────────┘      │
                      │                   │                   │
                      │                   │                   │
                分布式表路由 / 跨 Shard 聚合查询              │

Shard 内部：Replica1、Replica2 两个副本互为冗余，Replica1、Replica2 分别部署在不同物理机上，以应对单点故障。
跨 Shard：客户端通过分布式表（Distributed Engine）将查询分发至每个 Shard 下的副本，由 ZooKeeper 协调副本选择。

1.3 ZooKeeper 在分布式中的作用

ClickHouse 的分布式功能依赖 ZooKeeper 来保证以下核心功能：

DDL 同步
- 所有 Replica 在创建表、修改表结构时通过 ZooKeeper 写入变更路径，确保各节点同步执行 DDL。
复制队列管理（ReplicatedMergeTree）
- 每个 Replica 会将本地插入/删除任务写入 ZooKeeper 中对应分片的队列节点，其他 Replica 订阅该队列并拉取任务执行，实现数据复制。
分布式表元数据
- Distributed Engine 在 ZooKeeper 中读取集群信息，确定如何将某条 SQL 分发到各个分片。
副本故障检测与恢复
- ZooKeeper 记录当前可用 Replica 列表，当某个 Replica 宕机或网络不可达，其他 Replica 会继续提供写入与查询。

ZooKeeper 目录示例（部分）

/clickhouse/
   ├─ tables/
   │    └─ default.hits/            # hits 表对应的节点
   │         ├─ shard1/             # Shard1 下的所有 Replica
   │         │    ├─ leader_election -> 存储当前 leader 信息
   │         │    └─ queue/Replica1  -> 存储 Replica1 的写入操作
   │         └─ shard2/             # Shard2 下
   │              └─ queue/Replica3
   ├─ macros/                       # 宏定义，可在配置中使用
   └─ replication_alter_columns/... # DDL 同步信息

2. 环境准备与组件安装

本文以 Ubuntu 20.04 为示例操作系统，假设即将部署 2 个 Shard，每个 Shard 2 个 Replica，共 4 台 ClickHouse 节点，并使用 3 节点 ZooKeeper 集群保障高可用。

2.1 系统与网络要求

操作系统
- 建议使用 Debian/Ubuntu/CentOS 等 Linux 发行版，本文以 Ubuntu 20.04 为例。
网络连通性
- 所有节点之间需互相能通：
```
ping zk1 zk2 zk3
ping click1 click2 click3 click4
```
- 关闭防火墙或放通必要端口：
  - ZooKeeper：2181（客户端访问）、2888/3888（集群内部选举）。
  - ClickHouse：9000（TCP 协议，默认客户端端口）、8123（HTTP 接口）、9009（Keeper 通信，若启用 Keeper 模式，可忽略）。
时间同步
- 建议使用 NTP 或 chrony 保证各节点时间同步，否则会影响 ReplicatedMergeTree 的副本选举与健康检查。
```
sudo apt-get install chrony
sudo systemctl enable chrony
sudo systemctl start chrony
```

2.2 安装 ZooKeeper 集群

在 3 台节点（假设 IP 分别为 192.168.1.10/11/12）上完成 ZooKeeper 安装与集群配置。

2.2.1 下载与解压

# 在每台机器执行
wget https://archive.apache.org/dist/zookeeper/zookeeper-3.7.1/apache-zookeeper-3.7.1-bin.tar.gz
tar -zxvf apache-zookeeper-3.7.1-bin.tar.gz -C /opt/
ln -s /opt/apache-zookeeper-3.7.1-bin /opt/zookeeper

2.2.2 配置 zoo.cfg

# 编辑 /opt/zookeeper/conf/zoo.cfg （如果目录下无 zoo.cfg 示例，可复制 conf/zoo_sample.cfg）
cat <<EOF > /opt/zookeeper/conf/zoo.cfg
tickTime=2000
initLimit=10
syncLimit=5
dataDir=/var/lib/zookeeper
clientPort=2181
# 集群内部通信端口（选举与同步）
server.1=192.168.1.10:2888:3888
server.2=192.168.1.11:2888:3888
server.3=192.168.1.12:2888:3888
EOF

2.2.3 创建 dataDir 与 myid

# 在每台机器分别执行
sudo mkdir -p /var/lib/zookeeper
sudo chown $(whoami):$(whoami) /var/lib/zookeeper

# 将编号写入 myid（与 zoo.cfg 中 server.N 对应）
# 机器 192.168.1.10
echo "1" > /var/lib/zookeeper/myid
# 机器 192.168.1.11
echo "2" > /var/lib/zookeeper/myid
# 机器 192.168.1.12
echo "3" > /var/lib/zookeeper/myid

2.2.4 启动 ZooKeeper

# 同步在 3 台节点上启动
/opt/zookeeper/bin/zkServer.sh start
# 检查集群状态
/opt/zookeeper/bin/zkServer.sh status
# 期望输出类似 “Mode: leader” 或 “Mode: follower”

至此，3 节点 ZooKeeper 集群已启动并形成仲裁，可支持多副本 ClickHouse 的元数据管理。

2.3 安装 ClickHouse 节点

在 4 台 ClickHouse 节点（假设 IP 为 192.168.1.20/21/22/23）上，按照以下步骤安装 ClickHouse：

2.3.1 安装 Yandex 官方仓库并安装

# 安装官方 GPG Key
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv E0C56BD4
# 添加仓库
echo "deb https://repo.clickhouse.com/deb/stable/ main/" | sudo tee /etc/apt/sources.list.d/clickhouse.list
# 更新并安装
sudo apt-get update
sudo apt-get install -y clickhouse-server clickhouse-client

2.3.2 配置防火墙与端口

# 放通 TCP 9000、8123、9009 端口（若使用 CentOS，可用 firewalld 或 iptables）
sudo ufw allow 9000/tcp
sudo ufw allow 8123/tcp
sudo ufw allow 9009/tcp
sudo ufw reload

2.3.3 启动 ClickHouse 服务

sudo systemctl enable clickhouse-server
sudo systemctl start clickhouse-server
# 查看日志，确认正常启动
sudo journalctl -u clickhouse-server -f

注意：此时 ClickHouse 还未配置分布式功能，仅是默认的单节点模式。

3. 分布式集群部署示例

下面以 2 Shard × 2 Replica 为例，演示如何将 4 个 ClickHouse 节点组成分布式集群。假设对应节点如下：

Shard1
- Replica1：192.168.1.20（click1）
- Replica2：192.168.1.21（click2）
Shard2
- Replica1：192.168.1.22（click3）
- Replica2：192.168.1.23（click4）

3.1 集群拓扑设计与图解

            ┌────────────────────────────────────────────────┐
            │                   ZooKeeper 3 节点           │
            │   [192.168.1.10, 11, 12] 端口 2181,2888,3888  │
            └────────────────────────────────────────────────┘
                        │              │              │
       ┌────────────────┴──────────────┴──────────────┴───────────────┐
       │                    ClickHouse 分布式集群                       │
       │ Shard1                                  Shard2                 │
       │ ┌───────────┐ ┌───────────┐         ┌───────────┐ ┌───────────┐ │
       │ │ click1    │ │ click2    │         │ click3    │ │ click4    │ │
       │ │ (Replica) │ │ (Replica) │         │ (Replica) │ │ (Replica) │ │
       │ │ zk:2181   │ │ zk:2181   │         │ zk:2181   │ │ zk:2181   │ │
       │ └───────────┘ └───────────┘         └───────────┘ └───────────┘ │
       └───────────────────────────────────────────────────────────────┘
               │                  │              │                  │
               │  ReplicatedMergeTree 本地表 (pathy)  │ Distributed 表 (path) │
               │  数据分片 & 自动复制                 │ 跨 Shard 查询路由     │

ZooKeeper：运行在 192.168.1.10/11/12:2181
click1/click2：Shard1 的 2 个 Replica，两个节点负责存储 Shard1 的数据，数据通过 ZooKeeper 自动复制。
click3/click4：Shard2 的 2 个 Replica，同理。

3.2 ZooKeeper 配置

上文已完成 ZooKeeper 集群搭建，确认集群健康后，ClickHouse 参考以下 ZooKeeper 连接方式即可。

<!-- /etc/clickhouse-server/config.xml （各节点相同，只需保证 zk 配置正确） -->
<yandex>
    <!-- 其他配置省略 -->
    <zookeeper>
        <node>
            <host>192.168.1.10</host>
            <port>2181</port>
        </node>
        <node>
            <host>192.168.1.11</host>
            <port>2181</port>
        </node>
        <node>
            <host>192.168.1.12</host>
            <port>2181</port>
        </node>
    </zookeeper>
    <!-- 更多配置... -->
</yandex>

3.3 ClickHouse `config.xml` 与 `users.xml` 配置

为了实现 ReplicatedMergeTree 与 Distributed 引擎，需修改以下配置文件。

3.3.1 修改 `config.xml`

编辑 /etc/clickhouse-server/config.xml，在 <yandex> 节点内添加以下段落：

<yandex>
    <!-- ... 原有配置 ... -->

    <!-- ZooKeeper 节点 (已如上所示) -->
    <zookeeper>
        <node>
            <host>192.168.1.10</host>
            <port>2181</port>
        </node>
        <node>
            <host>192.168.1.11</host>
            <port>2181</port>
        </node>
        <node>
            <host>192.168.1.12</host>
            <port>2181</port>
        </node>
    </zookeeper>

    <!-- 为分布式部署添加 shards 与 replicas 定义 -->
    <remote_servers>
        <!-- 定义一个逻辑集群名 cluster1，包含 2 个 shard -->
        <cluster1>
            <shard>
                <replica>
                    <host>192.168.1.20</host>
                    <port>9000</port>
                </replica>
                <replica>
                    <host>192.168.1.21</host>
                    <port>9000</port>
                </replica>
            </shard>
            <shard>
                <replica>
                    <host>192.168.1.22</host>
                    <port>9000</port>
                </replica>
                <replica>
                    <host>192.168.1.23</host>
                    <port>9000</port>
                </replica>
            </shard>
        </cluster1>
    </remote_servers>

    <!-- 定义默认数据库 macros，方便在 SQL 中使用 {cluster} -->
    <macros>
        <cluster>cluster1</cluster>
        <shard>shard1</shard> <!-- 可留空，主要使用 macros.cluster -->
    </macros>

    <!-- 持久化参数，以及其他可选配置 -->
    <!-- ... -->
</yandex>

<remote_servers>
- 定义逻辑集群名称 cluster1，下有两个 <shard> 节点，每个 <shard> 下有若干 <replica>。
- 在后续创建 Distributed 表时，会引用 cluster1，ClickHouse 自动根据此配置将查询分发到各 shard 下的一个副本。
<macros>
- 定义了 {cluster} 宏，后续 SQL 可直接使用 remote('cluster1', ...) 或 {cluster}。

修改完成后，重启 ClickHouse 节点以使配置生效：

sudo systemctl restart clickhouse-server

3.3.2 修改 `users.xml`（可选）

若需为分布式表访问设置白名单，建议修改 /etc/clickhouse-server/users.xml，在相应用户下添加 <networks>：

<!-- users.xml 片段 -->
<profiles>
    <default>
        <!-- 其他配置 -->
    </default>
</profiles>

<users>
    <default>
        <password></password>
        <networks>
            <ip>::/0</ip> <!-- 允许任意 IP 访问 -->
        </networks>
        <profile>default</profile>
        <quota>default</quota>
    </default>
</users>

若公司内部有统一授权管理，可为特定用户专门配置分布式访问权限。

3.4 启动 ClickHouse 服务与校验

重启所有 ClickHouse 节点

sudo systemctl restart clickhouse-server

校验 ZooKeeper 连接
```
clickhouse-client --query="SELECT * FROM system.zookeeper WHERE path LIKE '/clickhouse/%' LIMIT 5;"
```
- 若能正常返回节点信息，则表明 ClickHouse 成功连接到 ZooKeeper。
校验 remote_servers 配置是否生效
在任意一台节点上执行：
```
clickhouse-client --query="SELECT host_name(), version();"
# 查看本地信息
```
然后执行跨集群的 Hello 查询：
```
clickhouse-client --query="SELECT * FROM remote('cluster1', system.one) LIMIT 4;"
```
- 该查询会在 cluster1 下的每个 Replica 上执行 SELECT * FROM system.one LIMIT 1，汇总 4 条记录。如果能正常返回 4 条，则表示 remote\_servers 生效。

4. 分布式表引擎与表创建

在完成分布式部署后，需要了解 ClickHouse 提供的几种常见表引擎，并结合分布式场景设计合适的表结构。

4.1 MergeTree 与 ReplicatedMergeTree 引擎

MergeTree 系列
- 最常用的引擎，适用于单机场景或非严格高可用需求。
- 支持分区（PARTITION BY）、排序键（ORDER BY）、TTL、物化视图等。
- 示例创建：
```
CREATE TABLE default.events_mt (
  dt Date,
  user_id UInt64,
  action String,
  value Float32
)
ENGINE = MergeTree()
PARTITION BY toYYYYMM(dt)
ORDER BY (user_id, dt);
```

ReplicatedMergeTree 系列

在 MergeTree 基础上，增加了通过 ZooKeeper 实现副本复制与容灾能力。
需要传入两个重要参数：
1. ZooKeeper 路径：例如 /clickhouse/tables/{database}.{table}/shardN。
2. Replica 名称：在同一 Shard 下需唯一，如 replica1、replica2。

示例创建（在 Shard1 下的两个 Replica 分别执行）：

CREATE TABLE default.events_shard1_replica1 (
  dt Date,
  user_id UInt64,
  action String,
  value Float32
)
ENGINE = ReplicatedMergeTree(
  '/clickhouse/tables/default.events/shard1',  -- ZooKeeper 路径
  'replica1'                                   -- Replica 名称
)
PARTITION BY toYYYYMM(dt)
ORDER BY (user_id, dt);

CREATE TABLE default.events_shard1_replica2 (
  dt Date,
  user_id UInt64,
  action String,
  value Float32
)
ENGINE = ReplicatedMergeTree(
  '/clickhouse/tables/default.events/shard1',  -- 与 replica1 相同的路径
  'replica2'
)
PARTITION BY toYYYYMM(dt)
ORDER BY (user_id, dt);

Shard2 下分别创建两个 Replica

CREATE TABLE default.events_shard2_replica1 (
  dt Date,
  user_id UInt64,
  action String,
  value Float32
)
ENGINE = ReplicatedMergeTree(
  '/clickhouse/tables/default.events/shard2',
  'replica1'
)
PARTITION BY toYYYYMM(dt)
ORDER BY (user_id, dt);

CREATE TABLE default.events_shard2_replica2 (
  dt Date,
  user_id UInt64,
  action String,
  value Float32
)
ENGINE = ReplicatedMergeTree(
  '/clickhouse/tables/default.events/shard2',
  'replica2'
)
PARTITION BY toYYYYMM(dt)
ORDER BY (user_id, dt);

说明：
ZooKeeper 路径 '/clickhouse/tables/default.events/shard1' 与 Shard 名称保持一致，有助于后续维护。
每个 Shard 下的 Replica 都指定相同的 ZooKeeper 路径，Replica 在同一路径上协调数据复制。

4.2 Distributed 引擎原理与实现

Distributed 引擎
- 提供跨 Shard 的查询路由能力，本质上是一个逻辑视图，将查询分发到建在各 Shard 下的本地表，再在客户端聚合结果。
- 创建时需要指定：
  1. 集群名称：与 config.xml 中 remote_servers 配置保持一致，如 cluster1。
  2. 数据库和表名：在各 Replica 上实际存在的本地表名（如 default.events_shard1_replica1、..._replica2、...shard2_replica1、...shard2_replica2）。
  3. 分片键（可选）：用于将写入分发到某个 Shard，而不是广播到所有 Shard。
- 示例创建：
```
CREATE TABLE default.events_distributed (
  dt Date,
  user_id UInt64,
  action String,
  value Float32
)
ENGINE = Distributed(
  'cluster1',    -- 与 config.xml 中 remote_servers 的 <cluster1>
  'default',     -- 数据库名
  'events_local',-- 各 Shard 对应的本地表前缀（需在各节点上创建同名本地表）
  rand()         -- 分片键，可改为 cityHash64(user_id)
);
```
- 由于各 Shard 下的本地表可能使用 ReplicatedMergeTree 并加入了 Replica 后缀，为简化管理，可在各 local 表下创建一个同名别名表 events_local，指向当前 Replica。示例：
  每台节点（click1\~click4）都创建一个同名的本地别名表：
```
CREATE TABLE default.events_local AS default.events_shard1_replica1;  -- click1
CREATE TABLE default.events_local AS default.events_shard1_replica2;  -- click2
CREATE TABLE default.events_local AS default.events_shard2_replica1;  -- click3
CREATE TABLE default.events_local AS default.events_shard2_replica2;  -- click4
```
  这样，在 Distributed 引擎中只需引用 events_local，ClickHouse 会自动查找每个节点上对应的本地表。

4.3 本地表与分布式表创建示例

下面结合 Shard1/Shard2、Replica1/Replica2 全流程示例。

4.3.1 Shard1 Replica1 上创建本地表

-- 点击 click1 (Shard1 Replica1)
CREATE DATABASE IF NOT EXISTS default;

CREATE TABLE default.events_shard1_replica1 (
  dt Date,
  user_id UInt64,
  action String,
  value Float32
)
ENGINE = ReplicatedMergeTree(
  '/clickhouse/tables/default.events/shard1',
  'replica1'
)
PARTITION BY toYYYYMM(dt)
ORDER BY (user_id, dt);

4.3.2 Shard1 Replica2 上创建本地表

-- 点击 click2 (Shard1 Replica2)
CREATE DATABASE IF NOT EXISTS default;

CREATE TABLE default.events_shard1_replica2 (
  dt Date,
  user_id UInt64,
  action String,
  value Float32
)
ENGINE = ReplicatedMergeTree(
  '/clickhouse/tables/default.events/shard1',
  'replica2'
)
PARTITION BY toYYYYMM(dt)
ORDER BY (user_id, dt);

4.3.3 Shard2 Replica1 上创建本地表

-- 点击 click3 (Shard2 Replica1)
CREATE DATABASE IF NOT EXISTS default;

CREATE TABLE default.events_shard2_replica1 (
  dt Date,
  user_id UInt64,
  action String,
  value Float32
)
ENGINE = ReplicatedMergeTree(
  '/clickhouse/tables/default.events/shard2',
  'replica1'
)
PARTITION BY toYYYYMM(dt)
ORDER BY (user_id, dt);

4.3.4 Shard2 Replica2 上创建本地表

-- 点击 click4 (Shard2 Replica2)
CREATE DATABASE IF NOT EXISTS default;

CREATE TABLE default.events_shard2_replica2 (
  dt Date,
  user_id UInt64,
  action String,
  value Float32
)
ENGINE = ReplicatedMergeTree(
  '/clickhouse/tables/default.events/shard2',
  'replica2'
)
PARTITION BY toYYYYMM(dt)
ORDER BY (user_id, dt);

提示：在创建完上述本地表后，可使用以下命令检查副本同步是否正常：
-- 在任意节点执行
SELECT
  database,
  table,
  is_leader,
  queue_size,
  future_parts,
  parts_to_merge,
  last_queue_update,
  last_queue_update_time
FROM system.replicas
WHERE database = 'default' AND table LIKE 'events%';
查看 is_leader、queue_size 是否为 0，表示副本同步正常；若有积压任务，可等待或手动修复。

4.3.5 在每个节点上创建本地别名表

为了让分布式引擎统一使用同名本地表，建议在每个节点上都创建一个 events_local 别名表，指向上一步创建的 Replica 表。示例如下：

click1（Shard1 Replica1）

CREATE TABLE default.events_local AS default.events_shard1_replica1;

click2（Shard1 Replica2）

CREATE TABLE default.events_local AS default.events_shard1_replica2;

click3（Shard2 Replica1）

CREATE TABLE default.events_local AS default.events_shard2_replica1;

click4（Shard2 Replica2）

CREATE TABLE default.events_local AS default.events_shard2_replica2;

说明：别名表不会在存储目录再新建数据；它只是一个对 ReplicatedMergeTree 本地表的引用（ATTACH TABLE 方式）。如果希望更严格隔离，也可以使用 ATTACH TABLE 语法，但 AS ... 方式足够常见。

4.3.6 创建分布式表

在任意一台节点（建议使用 click1）上执行：

CREATE TABLE default.events_distributed (
  dt Date,
  user_id UInt64,
  action String,
  value Float32
)
ENGINE = Distributed(
  'cluster1',         -- 与 config.xml 中定义的集群名称
  'default',          -- 数据库名
  'events_local',     -- 各节点上本地表别名
  cityHash64(user_id) -- 分片键
);

关键说明：
cityHash64(user_id)：ClickHouse 内置的一种哈希函数，可将 user_id 映射到 [0, 2^64) 区间后再 % shard_count，分散写入到不同的 Shard。
如果不填分片键（如填 rand() 或 ''），则 Insert 操作会自动将每条记录广播到所有 Shard。

到此，分布式表与本地 Replica 表的创建已完成。

4.4 示例：查询分布式表的执行流程图解

┌─────────────────────────────────────────────────────────────────────────┐
│                         ClickHouse Client                              │
│   SELECT user_id, count() FROM default.events_distributed GROUP BY user_id  │
└─────────────────────────────────────────────────────────────────────────┘
                             │
                   查询路由到 cluster1
                             │
        ┌────────────────────┴────────────────────┐
        │                                         │
┌───────────────┐                       ┌───────────────┐
│    Shard1     │                       │    Shard2     │
│ (click1/2)    │                       │ (click3/4)    │
│ Distributed   │                       │ Distributed   │
│ Engine Worker │                       │ Engine Worker │
└───────┬───────┘                       └───────┬───────┘
        │      查询对应本地表 events_local             │      查询对应本地表 events_local
        ▼                                         ▼
┌───────────────┐                       ┌───────────────┐
│ Local Table   │                       │ Local Table   │
│ events_local  │                       │ events_local  │
│ (Shard1 Data) │                       │ (Shard2 Data) │
│ ReplicatedMT  │                       │ ReplicatedMT  │
└───────┬───────┘                       └───────┬───────┘
        │                                         │
        │ 执行 group by、count() 本地聚合            │ 执行本地聚合
        │                                         │
        ▼                                         ▼
┌──────────────────┐                     ┌──────────────────┐
│ Partial Results  │                     │ Partial Results  │
│ (user_id, count) │                     │ (user_id, count) │
└──────────┬───────┘                     └──────────┬───────┘
           │                                         │
           │         将部分结果汇总到客户端并进行最终合并         │
           └───────────────┬─────────────────────────────────────┘
                           ▼
                    客户端合并聚合结果
                           │
                           ▼
               返回最终 (user_id, total_count) 列表

Shard1/Shard2：分布式表引擎仅充当调度者，真正的计算在各节点本地的 events_local。
本地聚合：为了减少网络传输，ClickHouse 默认会先在本地执行 GroupBy、聚合等操作，只有聚合后较小的中间结果通过网络返回再做最终合并。这样能显著提高分布式查询性能。

5. 数据写入、查询与负载均衡

完成表结构创建后，接下来演示如何将数据写入分布式表与查询，以及写入时如何自动分片或广播。

5.1 写入到 ReplicatedMergeTree 且分片自动路由

使用分布式表写入
- 推荐通过分布式表 events_distributed 写入，ClickHouse 会根据 cityHash64(user_id) % shard_count 自动将数据路由到相应 Shard 的 Replica（随机选择一个可用 Replica 写入）。
- 示例插入 3 条数据，user\_id 为 1、2、3：
```
INSERT INTO default.events_distributed VALUES
('2023-09-01', 1, 'click', 10.5),
('2023-09-01', 2, 'view', 5.0),
('2023-09-01', 3, 'purchase', 100.0);
```
  - 若 Shard Count=2，那么：
    - 对于 user_id = 1：cityHash64(1) % 2 = 1（假设），路由到 Shard2；
    - user_id = 2：%2 = 0，写入 Shard1；
    - user_id = 3：%2 = 1，写入 Shard2。
写入副本选择
- Shard 内部多个 Replica 会随机选择一个可写 Replica；若写入的 Replica 挂掉，其他 Replica 会接受写入请求。写入后，Replica 间基于 ZooKeeper 自动同步数据。

5.2 分布式表查询流程详解

查询 events_distributed
- 当执行 SELECT * FROM events_distributed WHERE user_id = 2; 时，ClickHouse 会根据分片键 cityHash64(2) % 2 计算出目标 Shard（Shard1），并将查询请求发给 Shard1 的一个 Replica。
- 然后在该 Replica 上查询 events_local（即 Shard1 本地的 ReplicatedMergeTree 表），返回结果。
- 如果 Query 涉及跨 Shard（如 GROUP BY 或不带 WHERE 的 SELECT *），则请求会广播到所有 Shard，每个 Shard 返回部分结果，最后由客户端合并。
分布式聚合与性能
- 对于大表聚合查询，分布式表引擎会首先在每个 Shard 本地进行“部分聚合（partial aggregation）”，然后再把各 Shard 的部分结果收集到一个节点进行“最终聚合（final aggregation）”，大幅减少网络传输量。

5.3 Insert、Select 示例

批量插入示例

INSERT INTO default.events_distributed
SELECT 
  toDate('2023-09-02') AS dt, 
  number AS user_id, 
  'auto' AS action, 
  number * 1.1 AS value
FROM numbers(100000)  -- 生成 100,000 条测试数据
WHERE number < 10000; -- 只写入前 10,000 条

查询示例

-- 查看 Shard1 上的数据量（仅在 Shard1 的 click1 或 click2 节点上执行）
SELECT count(*) FROM default.events_shard1_replica1;
SELECT count(*) FROM default.events_shard1_replica2;

-- 查询分布式表中的总数据量
SELECT count(*) FROM default.events_distributed;

-- 分布式聚合示例
SELECT user_id, count() AS cnt
FROM default.events_distributed
GROUP BY user_id
ORDER BY cnt DESC
LIMIT 10;

验证数据一致性
在 Shard1 Replica1 与 Replica2 上分别查询本地表，确认两者数据同步：
```
SELECT count(*) FROM default.events_shard1_replica1;
SELECT count(*) FROM default.events_shard1_replica2;
```

6. 数据迁移与同步策略

在实际生产中，经常需要将已有数据迁移到新的分布式 ClickHouse 集群，或与外部数据库（如 MySQL）集成，实现实时或离线数据同步。下面介绍几种常见迁移与同步方案。

6.1 单机 ClickHouse 到分布式集群迁移

假设已有一个单节点 ClickHouse（192.168.1.30），其中有表 default.events_single，需要将其数据迁移到上述分布式集群并保持不间断服务。

6.1.1 在新集群创建同结构的分布式表

在新集群创建 ReplicatedMergeTree 本地表与 Distributed 表（与前节示例一致）。
确保 events_distributed 已就绪。

6.1.2 使用 `INSERT SELECT` 迁移数据

在原单节点上执行以下操作，将数据复制到分布式表（通过 clickhouse-client 连接到分布式集群任一节点即可）：

clickhouse-client --host=192.168.1.20 --query="
INSERT INTO default.events_distributed
SELECT * FROM remote('single_host', default, 'events_single')
"

需先在 config.xml 的 remote_servers 中配置 single_host，以便分布式查询原节点数据。示例配置（在每个新集群节点的 /etc/clickhouse-server/config.xml 添加）：

<remote_servers>
    <single_host_cluster>
        <shard>
            <replica>
                <host>192.168.1.30</host>
                <port>9000</port>
            </replica>
        </shard>
    </single_host_cluster>
</remote_servers>

然后在新集群中执行：

INSERT INTO default.events_distributed
SELECT * FROM remote('single_host_cluster', default, 'events_single');

上述操作会将单节点数据分批读取，并插入到分布式表，分布式表会自动分片到各 Shard。在数据量大的情况下，建议拆分范围分批执行，例如按照 dt 范围分区多次执行。

6.1.3 增量同步

在完成初次全量迁移后，可使用 ZooKeeper + Kafka 或持续抓取增量数据进入分布式表，以实现接近实时的迁移。

方案一：Materialized View + Kafka
- 在原单节点 ClickHouse 上创建一个 Kafka 引擎表，订阅写入事件；
- 创建一个 Materialized View，将 Kafka 中的数据插入到新集群的分布式表。
方案二：Debezium + Kafka Connect
- 使用 Debezium 将 MySQL/ClickHouse 的 Binlog 推到 Kafka；
- ClickHouse 侧使用 Kafka 引擎与 Materialized View 实时消费，插入分布式表。

6.2 MySQL 到 ClickHouse 的迁移示例（使用 Kafka 或 `clickhouse-mysql`）

很多场景需要将 MySQL 中的业务表迁移到 ClickHouse 进行高性能 OLAP 查询。常用方案如下：

6.2.1 使用 Kafka + ClickHouse Kafka 引擎

在 MySQL 中开启 Binlog，并使用 Kafka Connect + Debezium 将数据写入 Kafka 主题（如 mysql.events）。

在 ClickHouse 集群上创建 Kafka 引擎表

CREATE TABLE default.events_kafka (
  `dt` Date,
  `user_id` UInt64,
  `action` String,
  `value` Float32
) ENGINE = Kafka SETTINGS
  kafka_broker_list = 'kafka1:9092,kafka2:9092',
  kafka_topic_list = 'mysql.events',
  kafka_group_name = 'ch_consumer_group',
  kafka_format = 'JSONEachRow',
  kafka_num_consumers = 4;

创建 Materialized View
- Materialized View 将消费 events_kafka，并将数据插入分布式表：
```
CREATE MATERIALIZED VIEW default.events_mv TO default.events_distributed AS
SELECT
  dt,
  user_id,
  action,
  value
FROM default.events_kafka;
```
- 这样，Kafka 中的新数据会自动被 MV 推送到分布式表，实现实时同步。

6.2.2 使用 `clickhouse-mysql` 工具

clickhouse-mysql 是社区提供的一个 Python 脚本，可直接将 MySQL 表结构与数据迁移到 ClickHouse。

安装依赖
```
pip install clickhouse-mysql
```

执行迁移命令

clickhouse-mysql --mysql-host mysql_host --mysql-port 3306 --mysql-user root --mysql-password secret \
  --clickhouse-host 192.168.1.20 --clickhouse-port 9000 --clickhouse-user default --clickhouse-password '' \
  --database mydb --table events --clickhouse-database default --clickhouse-table events_distributed

默认会将 MySQL 表自动映射为 ClickHouse 表，如创建合适的 MergeTree 引擎表，再批量插入数据。
对于分布式环境，可先在新集群创建分布式表，再指定 --clickhouse-table 为分布式表，脚本会自动往分布式表写入数据。

6.3 `clickhouse-copier` 工具使用

clickhouse-copier 是 ClickHouse 社区自带的工具，可在集群内部做分片间或集群间的数据搬迁。

准备复制任务的配置文件（copier_config.xml）

<copy>
  <shard>
    <cluster>cluster1</cluster>
    <replica>click1</replica>
  </shard>
  <shard>
    <cluster>cluster1</cluster>
    <replica>click3</replica>
  </shard>

  <tables>
    <table>
      <database>default</database>
      <name>events_local</name>
    </table>
  </tables>
</copy>

上述示例将指定将 events_local 从 Shard1 的 click1 复制到 Shard2 的 click3，需根据实际场景配置更多 <shard> 与 <table>。

执行复制
```
clickhouse-copier --config /path/to/copier_config.xml --replication 0
```
- --replication 0 表示不做 ReplicatedMergeTree 的基于日志复制，仅做一次全量迁移。
- 适用于集群扩容、分片重平衡等操作。

6.4 `INSERT SELECT` 与外部表引擎同步

INSERT SELECT
- 适用于跨集群、跨数据库全量复制：
```
INSERT INTO default.events_distributed
SELECT * FROM default.events_local WHERE dt >= '2023-09-01';
```
- 可分批（按日期、ID 范围）多次执行。
外部表引擎
- ClickHouse 支持通过 MySQL 引擎访问 MySQL 表，如：
```
CREATE TABLE mysql_events (
  dt Date,
  user_id UInt64,
  action String,
  value Float32
)
ENGINE = MySQL('mysql_host:3306', 'mydb', 'events', 'root', 'secret');
```
- 然后可在 ClickHouse 侧做：
```
INSERT INTO default.events_distributed
SELECT * FROM mysql_events;
```
- 外部表引擎适合数据量相对较小或批量一次性导入，若是实时增量同步，仍推荐 Kafka + Materialized View。

6.5 实时同步示例：使用 Kafka 引擎 + Materialized View

在 MySQL 侧将 Binlog 推到 Kafka 后，ClickHouse 侧通过 Kafka 引擎表 + MV，实现近实时同步。

MySQL → Kafka
- 部署 Kafka 集群。
- 使用 Debezium Connector for MySQL，将 MySQL Binlog 写入 Kafka 主题 mysql.events_binlog。

ClickHouse 侧创建 Kafka 表

CREATE TABLE default.events_binlog_kafka (
  dt Date,
  user_id UInt64,
  action String,
  value Float32
) ENGINE = Kafka SETTINGS
  kafka_broker_list = 'k1:9092,k2:9092',
  kafka_topic_list = 'mysql.events_binlog',
  kafka_group_name = 'ch_binlog_consumer',
  kafka_format = 'JSONEachRow',
  kafka_num_consumers = 4;

创建 Materialized View
```
CREATE MATERIALIZED VIEW default.events_binlog_mv TO default.events_distributed AS
SELECT dt, user_id, action, value
FROM default.events_binlog_kafka;
```
- 当 Kafka 有新消息（INSERT/UPDATE/DELETE）时，MV 自动触发，将数据写入分布式表。
- 对于 UPDATE/DELETE，可根据具体业务需求将这些操作转化为 ClickHouse 的 MergeTree 修改或 VXIN 等逻辑。

7. 运维与监控要点

在生产环境下，ClickHouse 分布式集群的健壮性和性能调优尤为关键。以下介绍一些常见的运维与监控要点。

7.1 ZooKeeper 集群监控

节点状态检查

echo ruok | nc 192.168.1.10 2181  # 返回 imok 则正常
echo stat | nc 192.168.1.10 2181  # 查看节点状态、客户端连接数

集群状态检查
```
echo srvr | nc 192.168.1.10 2181
```
- 可查看是否有选举 leader、是否存在掉线节点等。
监控指标
- 使用 Prometheus JMX Exporter + Grafana 监控 ZooKeeper 的请求延时、连接数、选举延时等。

7.2 ClickHouse 节点健康检查

系统表

system.replication_queue：查看各 Replica 的复制队列积压情况。

SELECT database, table, is_currently_executing, parts_to_merge, queue_size 
FROM system.replication_queue;

system.mutations：查看表的 mutations（更新/删除）状态。

SELECT database, table, mutation_id, is_done, parts_to_do, parts_done 
FROM system.mutations;

system.parts：查看数据分区与磁盘占用情况。

SELECT database, table, partition, name, active, bytes_on_disk 
FROM system.parts WHERE database='default' AND table LIKE 'events%';

system.metrics / system.events：监控 ClickHouse 实时指标，如 Query、Insert 吞吐量，Cache 命中率等。

持续监控
- 使用 ClickHouse-Prometheus Exporter + Grafana，可监控：
  - Queries per second
  - Replication lag
  - Merge 任务数
  - 内存使用占比
  - 磁盘 I/O

7.3 分片与副本恢复流程

7.3.1 Replica 加入流程

新增 Replica
- 在一个 Shard 下新增 Replica，先在 ZooKeeper 对应路径下创建新 Replica 的目录。
- 在新节点上创建本地表（表结构需与原 Shard 保持一致），并指定新的 Replica 名称。
- 启动 ClickHouse，该 Replica 会从 ZooKeeper 上的复制队列拉取现有数据，完成全量数据复制。
Shard 扩容（横向扩容）
- 如果要增加 Shard 数量（比如从 2 个 Shard 扩容到 3 个），则需：
  - 暂停写入，或者使用 clickhouse-copier 做分片重平衡。
  - 在新节点上创建对应的本地 ReplicatedMergeTree 表，指定新的 Shard 路径。
  - 使用 clickhouse-copier 或脚本将已有数据重分布到新的 Shard。

7.3.2 副本修复流程

当某个 Replica 节点发生故障并恢复后，需要让它重新同步数据：

重启节点，它会检测到 ZooKeeper 上已有的副本信息。
Replica 恢复复制，从 Leader 主动拉取尚未复制的分区文件并恢复。

检查状态

SELECT database, table, replica_name, is_leader, queue_size 
FROM system.replicas WHERE database='default' AND table LIKE 'events%';

queue_size=0 且 is_currently_executing=0 表示恢复完成。

7.4 备份与恢复策略

备份工具
- Altinity ClickHouse Backup：社区推荐备份工具。支持全量/增量备份与恢复。
- 也可手动使用 clickhouse-client --query="SELECT * FROM table FORMAT Native" 导出，然后再用 clickhouse-client --query="INSERT INTO table FORMAT Native" 导入。
ZooKeeper 数据备份
- 可使用 zkCli.sh 导出关键路径的节点数据，以及定期备份 /var/lib/zookeeper/version-2。
恢复流程
1. 恢复 ZooKeeper 数据，保证 ReplicatedMergeTree 的队列信息完整。
2. 重启 ClickHouse，Replica 会从 ZooKeeper 获取需要恢复的分区；
3. 如果只想恢复部分数据，可手动删除对应的本地分区文件，再让 Replica 重新执行复制。

8. 常见问题与优化建议

在 ClickHouse 分布式生产环境中，经常会遇到性能瓶颈、数据倾斜、Shard 节点不均衡等问题。下面总结一些常见问题与优化技巧。

8.1 查询慢或分布式 JOIN 性能优化

避免跨 Shard JOIN
- ClickHouse 的分布式 JOIN 在多 Shard 场景下需要将数据从一个 Shard 拉取到另一个 Shard 进行 Join，网络 I/O 成本高。建议：
  - 数据预聚合（Denormalization）：将需要关联的数据预先合并到同一个表中；
  - 使用物化视图：在本地 MergeTree 表上预先计算好关键信息；
  - 单 Shard 物理表：如果某个表非常小，可把它复制到每个 Shard 上本地 Join。
Distributed 聚合优化
- 对于大规模聚合查询，建议先在本地执行聚合（aggregate_overflow_mode='throw'），再在客户端进行最终合并。
- 使用 settings max_threads = X, max_memory_usage = Y 控制查询资源消耗。

8.2 数据倾斜与分片键设计

数据倾斜
- 如果分片键导出的数据在某个 Shard 过多而其他 Shard 较少，导致 Shard1 负载过重，Shards2/3 空闲。
- 解决方案：
  - 重新设计分片键，例如使用复合键或哈希函数与随机数结合；
  - 动态调整分片策略，使用一致性哈希等更均衡的方案；
  - 扩容 Shard 节点，将热点数据分摊到更多 Shard。

8.3 磁盘、内存、网络调优

磁盘性能
- 推荐使用 SSD 或 NVMe，至少提供 10,000+ IOPS；
- ClickHouse 在 Merge 任务、高并发写入时对磁盘 I/O 敏感。可使用 RAID0 多盘并行提升吞吐。
内存配置
- 设置合理的 max_memory_usage
- 调整 [max_threads] 来控制并行度，避免 OOM；
- 若有大量 Map/Join 操作，可考虑开启 [join_use_nulls_for_low_cardinality_keys] 以减少内存占用。
网络带宽与延迟
- 分布式查询与复制都依赖网络：
  - 使用至少 10Gb/s 以降低跨 Shard 数据传输延迟；
  - 配置 max_distributed_connections、receive_timeout、send_timeout 等参数优化通信。

9. 总结

本文从 ClickHouse 分布式架构原理入手，详细讲解了如何在生产环境下：

部署 ZooKeeper 高可用集群，并配置 ClickHouse 节点连接；
设计分布式集群拓扑，实现 Shard 与 Replica 的高可用与负载均衡；
在各节点创建 ReplicatedMergeTree 本地表，通过 ZooKeeper 管理副本复制；
使用 Distributed 引擎创建逻辑表，自动实现跨 Shard 路由与分布式聚合；
演示数据写入与查询流程，并提供批量 Insert、Distributed 聚合等常见操作示例；
提供多种数据迁移方案，包括单机→分布式迁移、MySQL→ClickHouse 同步、Kafka 实时同步等全流程；
总结运维与监控要点，探讨 Replica 恢复、Shard 扩容、性能调优等实战经验；
针对常见问题给出优化建议，如数据倾斜、跨 Shard JOIN 降低网络开销、硬件选型等。

通过本文内容，你可以：

搭建一个稳定的 ClickHouse 分布式集群，实现数据的高可用与水平扩展；
利用 ReplicatedMergeTree 与 Distributed 引擎，灵活构建分布式表结构；
结合 Kafka、Materialized View、clickhouse-copier 等工具，实现多源异构数据迁移与实时同步；
在运维过程中通过系统表与监控手段快速排查问题，保证集群高效运行；
通过合理的分片键与硬件优化，避免数据倾斜与性能瓶颈。

- 阅读更多 -

‌Node.js数据库操作指南‌

System

2025-05-30

所有,nodejs,数据库

前言
环境配置与通用准备
Node.js 与 MySQL
- 3.1 安装与连接
- 3.2 增删改查示例
- 3.3 连接池与性能优化
- 3.4 事务示例
Node.js 与 PostgreSQL
- 4.1 安装与连接
- 4.2 增删改查示例
- 4.3 事务示例
Node.js 与 MongoDB
- 5.1 安装与连接
- 5.2 增删改查示例
- 5.3 常见索引与查询优化
使用 ORM：Sequelize 示例
- 6.1 安装与配置
- 6.2 定义模型与同步
- 6.3 增删改查示例
- 6.4 关联关系与事务
使用 ORM：TypeORM 示例
- 7.1 安装与配置
- 7.2 定义实体与数据库同步
- 7.3 增删改查示例
- 7.4 关联关系示例
常见问题与性能调优
总结

前言

数据库操作是后端应用的核心组成部分。在 Node.js 生态中，无论是使用原生驱动（如 mysql2、pg、mongodb），还是借助 ORM（Sequelize、TypeORM 等），都能高效地完成数据持久化操作。本指南将带你系统了解：

如何在 Node.js 中安装、配置并连接常见关系型与 NoSQL 数据库
各类 CRUD 操作示例，并通过代码与图解帮助理解底层流程
连接池与事务的使用，以及性能优化思路
ORM 框架（Sequelize、TypeORM）如何简化工作，并演示常见模型与关联操作

环境配置与通用准备

Node.js 版本：建议 v14 或以上（支持 async/await）。
包管理器：npm 或 yarn，以下示例均使用 npm。
数据库服务：本地或远程安装 MySQL、PostgreSQL、MongoDB。示例中假设本地数据库已启动并可连接。

打开终端，先初始化一个 Node.js 项目：

mkdir node-db-guide
cd node-db-guide
npm init -y

安装一些通用依赖（须根据后续示例逐个安装）：

npm install dotenv
npm install --save-dev nodemon

dotenv：用于加载 .env 环境变量文件，统一管理数据库连接信息等配置。
nodemon：开发阶段热重启脚本。

在项目根目录创建接口：.env，并填入示例数据库连接配置（请根据实际情况修改）：

# .env 示例
MYSQL_HOST=localhost
MYSQL_PORT=3306
MYSQL_USER=root
MYSQL_PASSWORD=123456
MYSQL_DATABASE=test_db

PG_HOST=localhost
PG_PORT=5432
PG_USER=postgres
PG_PASSWORD=123456
PG_DATABASE=test_db

MONGO_URI=mongodb://localhost:27017/test_db

在项目根目录新建 config.js，统一读取环境变量：

// config.js
require('dotenv').config();

module.exports = {
  mysql: {
    host: process.env.MYSQL_HOST,
    port: process.env.MYSQL_PORT,
    user: process.env.MYSQL_USER,
    password: process.env.MYSQL_PASSWORD,
    database: process.env.MYSQL_DATABASE
  },
  pg: {
    host: process.env.PG_HOST,
    port: process.env.PG_PORT,
    user: process.env.PG_USER,
    password: process.env.PG_PASSWORD,
    database: process.env.PG_DATABASE
  },
  mongoUri: process.env.MONGO_URI
};

Node.js 与 MySQL

3.1 安装与连接

推荐使用 mysql2 驱动，支持 Promise API。

npm install mysql2

代码示例：mysql-connection.js

// mysql-connection.js
const mysql = require('mysql2/promise');
const config = require('./config');

async function testMySQL() {
  // 1. 创建连接
  const connection = await mysql.createConnection({
    host: config.mysql.host,
    port: config.mysql.port,
    user: config.mysql.user,
    password: config.mysql.password,
    database: config.mysql.database
  });

  console.log('已连接到 MySQL');

  // 2. 执行简单查询
  const [rows] = await connection.query('SELECT NOW() AS now;');
  console.log('当前时间：', rows[0].now);

  // 3. 关闭连接
  await connection.end();
  console.log('连接已关闭');
}

testMySQL().catch(console.error);

运行：

node mysql-connection.js

输出示意：

已连接到 MySQL
当前时间： 2023-08-10T12:34:56.000Z
连接已关闭

图解：MySQL 连接流程

┌──────────────┐        ┌───────────┐
│ Node.js 应用 │──发送连接请求──▶│ MySQL 服务 │
└──────────────┘        └───────────┘
       ▲                        │
       │   连接成功／失败        │
       │◀───────────────────────┘

3.2 增删改查示例

假设已有一个名为 users 的表：

CREATE TABLE users (
  id INT AUTO_INCREMENT PRIMARY KEY,
  username VARCHAR(50) NOT NULL,
  email VARCHAR(100) NOT NULL,
  created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);

示例代码：mysql-crud.js

// mysql-crud.js
const mysql = require('mysql2/promise');
const config = require('./config');

async function runCRUD() {
  const conn = await mysql.createConnection(config.mysql);

  // 插入（Create）
  const [insertResult] = await conn.execute(
    'INSERT INTO users (username, email) VALUES (?, ?)',
    ['alice', 'alice@example.com']
  );
  console.log('插入用户 ID：', insertResult.insertId);

  // 查询（Read）
  const [rows] = await conn.execute('SELECT * FROM users WHERE id = ?', [
    insertResult.insertId
  ]);
  console.log('查询结果：', rows);

  // 更新（Update）
  const [updateResult] = await conn.execute(
    'UPDATE users SET email = ? WHERE id = ?',
    ['alice_new@example.com', insertResult.insertId]
  );
  console.log('更新受影响行数：', updateResult.affectedRows);

  // 删除（Delete）
  const [deleteResult] = await conn.execute(
    'DELETE FROM users WHERE id = ?',
    [insertResult.insertId]
  );
  console.log('删除受影响行数：', deleteResult.affectedRows);

  await conn.end();
}

runCRUD().catch(console.error);

执行与输出示意：

node mysql-crud.js

插入用户 ID： 1
查询结果： [ { id: 1, username: 'alice', email: 'alice@example.com', created_at: 2023-08-10T12:45:00.000Z } ]
更新受影响行数： 1
删除受影响行数： 1

3.3 连接池与性能优化

单次连接在高并发场景中非常 inefficient，推荐使用连接池。

示例代码：mysql-pool.js

// mysql-pool.js
const mysql = require('mysql2/promise');
const config = require('./config');

const pool = mysql.createPool({
  host: config.mysql.host,
  port: config.mysql.port,
  user: config.mysql.user,
  password: config.mysql.password,
  database: config.mysql.database,
  waitForConnections: true,
  connectionLimit: 10, // 最大连接数
  queueLimit: 0
});

async function queryUsers() {
  // 从连接池获取连接
  const conn = await pool.getConnection();
  try {
    const [rows] = await conn.query('SELECT * FROM users');
    console.log('所有用户：', rows);
  } finally {
    conn.release(); // 归还连接到池中
  }
}

async function main() {
  await queryUsers();
  // 程序结束时可以调用 pool.end() 关闭所有连接
  await pool.end();
}

main().catch(console.error);

连接池流程图（ASCII）

┌──────────────┐
│ Node.js 应用 │
└──────────────┘
       │
       ▼
┌─────────────────┐
│ 连接池 (Pool)    │
│ ┌─────────────┐ │
│ │ Connection1 │ │
│ │ Connection2 │ │
│ │   ...       │ │
│ └─────────────┘ │
└─────────────────┘
       ▲
       │
   多个并发请求

好处：

减少频繁创建/关闭连接的开销
复用空闲连接，提升并发吞吐
可通过 connectionLimit 控制最大并发连接数，防止数据库过载

3.4 事务示例

事务用于保证一系列 SQL 操作要么全部成功，要么全部回滚，常用于银行转账等场景。

示例代码：mysql-transaction.js

// mysql-transaction.js
const mysql = require('mysql2/promise');
const config = require('./config');

async function transferFunds(fromUserId, toUserId, amount) {
  const conn = await mysql.createConnection(config.mysql);

  try {
    // 开启事务
    await conn.beginTransaction();

    // 扣减转出方余额
    const [res1] = await conn.execute(
      'UPDATE accounts SET balance = balance - ? WHERE user_id = ?',
      [amount, fromUserId]
    );
    if (res1.affectedRows !== 1) throw new Error('扣款失败');

    // 增加转入方余额
    const [res2] = await conn.execute(
      'UPDATE accounts SET balance = balance + ? WHERE user_id = ?',
      [amount, toUserId]
    );
    if (res2.affectedRows !== 1) throw new Error('收款失败');

    // 提交事务
    await conn.commit();
    console.log('转账成功');
  } catch (err) {
    // 回滚事务
    await conn.rollback();
    console.error('转账失败，已回滚：', err.message);
  } finally {
    await conn.end();
  }
}

transferFunds(1, 2, 100).catch(console.error);

事务流程图（ASCII）

┌────────────────────────────────┐
│   conn.beginTransaction()     │
└─────────────┬──────────────────┘
              │
   ┌──────────▼──────────┐
   │ UPDATE accounts ... │
   │  res1                │
   └──────────┬──────────┘
              │
   ┌──────────▼──────────┐
   │ UPDATE accounts ... │
   │  res2                │
   └──────────┬──────────┘
              │
   ┌──────────▼──────────┐
   │   conn.commit()     │
   └─────────────────────┘

 （若任一步失败，则执行 conn.rollback()）

Node.js 与 PostgreSQL

4.1 安装与连接

使用 pg 驱动，支持 Pool 与事务。

npm install pg

示例代码：pg-connection.js

// pg-connection.js
const { Client } = require('pg');
const config = require('./config');

async function testPG() {
  const client = new Client({
    host: config.pg.host,
    port: config.pg.port,
    user: config.pg.user,
    password: config.pg.password,
    database: config.pg.database
  });
  await client.connect();
  console.log('已连接到 PostgreSQL');

  const res = await client.query('SELECT NOW() AS now;');
  console.log('当前时间：', res.rows[0].now);

  await client.end();
  console.log('连接已关闭');
}

testPG().catch(console.error);

运行：

node pg-connection.js

4.2 增删改查示例

假设有一个 products 表：

CREATE TABLE products (
  id SERIAL PRIMARY KEY,
  name VARCHAR(100) NOT NULL,
  price NUMERIC NOT NULL,
  created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);

示例代码：pg-crud.js

// pg-crud.js
const { Pool } = require('pg');
const config = require('./config');

const pool = new Pool({
  host: config.pg.host,
  port: config.pg.port,
  user: config.pg.user,
  password: config.pg.password,
  database: config.pg.database,
  max: 10
});

async function runCRUD() {
  // 插入
  const insertRes = await pool.query(
    'INSERT INTO products (name, price) VALUES ($1, $2) RETURNING id',
    ['Apple', 3.5]
  );
  const productId = insertRes.rows[0].id;
  console.log('插入产品 ID：', productId);

  // 查询
  const selectRes = await pool.query('SELECT * FROM products WHERE id = $1', [
    productId
  ]);
  console.log('查询结果：', selectRes.rows);

  // 更新
  const updateRes = await pool.query(
    'UPDATE products SET price = $1 WHERE id = $2',
    [4.0, productId]
  );
  console.log('更新受影响行数：', updateRes.rowCount);

  // 删除
  const deleteRes = await pool.query('DELETE FROM products WHERE id = $1', [
    productId
  ]);
  console.log('删除受影响行数：', deleteRes.rowCount);

  await pool.end();
}

runCRUD().catch(console.error);

4.3 事务示例

示例代码：pg-transaction.js

// pg-transaction.js
const { Pool } = require('pg');
const config = require('./config');

const pool = new Pool({
  host: config.pg.host,
  port: config.pg.port,
  user: config.pg.user,
  password: config.pg.password,
  database: config.pg.database,
  max: 10
});

async function transferFunds(fromId, toId, amount) {
  const client = await pool.connect();
  try {
    await client.query('BEGIN');

    const res1 = await client.query(
      'UPDATE accounts SET balance = balance - $1 WHERE user_id = $2',
      [amount, fromId]
    );
    if (res1.rowCount !== 1) throw new Error('扣款失败');

    const res2 = await client.query(
      'UPDATE accounts SET balance = balance + $1 WHERE user_id = $2',
      [amount, toId]
    );
    if (res2.rowCount !== 1) throw new Error('收款失败');

    await client.query('COMMIT');
    console.log('转账成功');
  } catch (err) {
    await client.query('ROLLBACK');
    console.error('转账失败，已回滚：', err.message);
  } finally {
    client.release();
  }
}

transferFunds(1, 2, 50).catch(console.error);

Node.js 与 MongoDB

5.1 安装与连接

使用官方驱动 mongodb 或 ODM mongoose。下面优先介绍 mongodb 官方驱动。

npm install mongodb

示例代码：mongo-connection.js

// mongo-connection.js
const { MongoClient } = require('mongodb');
const config = require('./config');

async function testMongo() {
  const client = new MongoClient(config.mongoUri, {
    useNewUrlParser: true,
    useUnifiedTopology: true
  });
  await client.connect();
  console.log('已连接到 MongoDB');

  const db = client.db(); // 默认 test_db
  const coll = db.collection('test_collection');

  // 插入文档
  const insertRes = await coll.insertOne({ name: 'Bob', age: 28 });
  console.log('插入文档 ID：', insertRes.insertedId);

  // 查询文档
  const doc = await coll.findOne({ _id: insertRes.insertedId });
  console.log('查询文档：', doc);

  await client.close();
}

testMongo().catch(console.error);

5.2 增删改查示例

假设使用 users 集合：

示例代码：mongo-crud.js

// mongo-crud.js
const { MongoClient, ObjectId } = require('mongodb');
const config = require('./config');

async function runCRUD() {
  const client = new MongoClient(config.mongoUri, {
    useNewUrlParser: true,
    useUnifiedTopology: true
  });
  await client.connect();
  const db = client.db();
  const users = db.collection('users');

  // 插入
  const { insertedId } = await users.insertOne({
    username: 'charlie',
    email: 'charlie@example.com',
    createdAt: new Date()
  });
  console.log('插入文档 ID：', insertedId);

  // 查询
  const user = await users.findOne({ _id: insertedId });
  console.log('查询结果：', user);

  // 更新
  const updateRes = await users.updateOne(
    { _id: insertedId },
    { $set: { email: 'charlie_new@example.com' } }
  );
  console.log('更新受影响文档数：', updateRes.modifiedCount);

  // 删除
  const deleteRes = await users.deleteOne({ _id: insertedId });
  console.log('删除受影响文档数：', deleteRes.deletedCount);

  await client.close();
}

runCRUD().catch(console.error);

5.3 常见索引与查询优化

在 MongoDB 中，为了让查询更高效，往往需要在常用筛选字段上创建索引。

示例：创建索引

// mongo-index.js
const { MongoClient } = require('mongodb');
const config = require('./config');

async function createIndex() {
  const client = new MongoClient(config.mongoUri, {
    useNewUrlParser: true,
    useUnifiedTopology: true
  });
  await client.connect();
  const db = client.db();
  const users = db.collection('users');

  // 在 username 字段上创建唯一索引
  await users.createIndex({ username: 1 }, { unique: true });
  console.log('已在 username 字段创建唯一索引');

  await client.close();
}

createIndex().catch(console.error);

查询优化思路

索引覆盖：只返回索引字段，无需回表。
分页查询：避免使用 skip 在大数据量时性能下降，推荐基于索引值做范围查询。
聚合管道：使用 $match、$project、$group 等聚合操作，以减少传输数据量并利用索引。

使用 ORM：Sequelize 示例

Sequelize 是 Node.js 中较为流行的 ORM，可同时支持 MySQL、PostgreSQL、SQLite 等。

6.1 安装与配置

npm install sequelize mysql2

示例代码：sequelize-setup.js

// sequelize-setup.js
const { Sequelize, DataTypes } = require('sequelize');
const config = require('./config');

const sequelize = new Sequelize(
  config.mysql.database,
  config.mysql.user,
  config.mysql.password,
  {
    host: config.mysql.host,
    port: config.mysql.port,
    dialect: 'mysql',
    logging: false
  }
);

async function testSequelize() {
  try {
    await sequelize.authenticate();
    console.log('Sequelize 已连接到数据库');

    // 定义模型
    const User = sequelize.define('User', {
      id: { type: DataTypes.INTEGER, primaryKey: true, autoIncrement: true },
      username: { type: DataTypes.STRING(50), allowNull: false, unique: true },
      email: { type: DataTypes.STRING(100), allowNull: false }
    }, {
      tableName: 'users',
      timestamps: true, // 自动添加 createdAt 和 updatedAt
      underscored: true // 字段名使用下划线风格
    });

    // 同步模型（如果表不存在则创建）
    await User.sync({ alter: true });
    console.log('User 模型已同步');

    // 创建记录
    const user = await User.create({ username: 'david', email: 'david@example.com' });
    console.log('创建用户：', user.toJSON());

    // 查询
    const users = await User.findAll();
    console.log('所有用户：', users.map(u => u.toJSON()));

    // 更新
    await User.update({ email: 'david_new@example.com' }, { where: { id: user.id } });
    console.log('已更新用户 email');

    // 删除
    await User.destroy({ where: { id: user.id } });
    console.log('已删除用户');
  } catch (err) {
    console.error('Sequelize 操作失败：', err);
  } finally {
    await sequelize.close();
  }
}

testSequelize();

6.2 定义模型与同步

在实际项目中，一般会将模型定义与 Sequelize 实例分开，方便维护。推荐目录结构：

models/
  index.js        # Sequelize 实例与初始化
  user.js         # User 模型定义
app.js            # 应用主入口

models/index.js

const { Sequelize } = require('sequelize');
const config = require('../config');

const sequelize = new Sequelize(
  config.mysql.database,
  config.mysql.user,
  config.mysql.password,
  {
    host: config.mysql.host,
    port: config.mysql.port,
    dialect: 'mysql',
    logging: false
  }
);

const db = {};
db.sequelize = sequelize;
db.Sequelize = Sequelize;

// 导入模型
db.User = require('./user')(sequelize, Sequelize);

module.exports = db;

models/user.js

module.exports = (sequelize, DataTypes) => {
  const User = sequelize.define('User', {
    id: { type: DataTypes.INTEGER, primaryKey: true, autoIncrement: true },
    username: { type: DataTypes.STRING(50), allowNull: false, unique: true },
    email: { type: DataTypes.STRING(100), allowNull: false }
  }, {
    tableName: 'users',
    timestamps: true,
    underscored: true
  });
  return User;
};

app.js

// app.js
const db = require('./models');

async function main() {
  try {
    await db.sequelize.authenticate();
    console.log('已连接到数据库 (Sequelize)');

    // 同步所有模型
    await db.sequelize.sync({ alter: true });
    console.log('模型同步完成');

    // 创建用户示例
    const newUser = await db.User.create({ username: 'eve', email: 'eve@example.com' });
    console.log('创建用户：', newUser.toJSON());
  } catch (err) {
    console.error(err);
  } finally {
    await db.sequelize.close();
  }
}

main();

6.3 增删改查示例

在 Sequelize 中，常用方法包括：

Model.create()：插入单条记录
Model.findAll({ where: {...} })：查询多条
Model.findOne({ where: {...} })：查询单条
Model.update({ fields }, { where: {...} })：更新
Model.destroy({ where: {...} })：删除

示例已在上节中演示，读者可在控制台运行并观察效果。

6.4 关联关系与事务

关联关系示例

假设有两个模型：User 和 Post，一对多关系，一个用户可有多篇文章。

定义模型：models/post.js

module.exports = (sequelize, DataTypes) => {
  const Post = sequelize.define('Post', {
    id: { type: DataTypes.INTEGER, primaryKey: true, autoIncrement: true },
    title: { type: DataTypes.STRING(200), allowNull: false },
    content: { type: DataTypes.TEXT, allowNull: false },
    userId: { type: DataTypes.INTEGER, allowNull: false }
  }, {
    tableName: 'posts',
    timestamps: true,
    underscored: true
  });
  return Post;
};

在 models/index.js 中配置关联：

const db = {};
db.sequelize = sequelize;
db.Sequelize = Sequelize;

db.User = require('./user')(sequelize, Sequelize);
db.Post = require('./post')(sequelize, Sequelize);

// 定义关联
db.User.hasMany(db.Post, { foreignKey: 'userId', as: 'posts' });
db.Post.belongsTo(db.User, { foreignKey: 'userId', as: 'author' });

module.exports = db;

使用关联：

// association-example.js
const db = require('./models');

async function associationDemo() {
  await db.sequelize.sync({ alter: true });

  // 创建用户与文章
  const user = await db.User.create({ username: 'frank', email: 'frank@example.com' });
  await db.Post.create({ title: 'Hello World', content: 'This is first post.', userId: user.id });

  // 查询用户并包含文章
  const result = await db.User.findOne({
    where: { id: user.id },
    include: [{ model: db.Post, as: 'posts' }]
  });
  console.log('用户与其文章：', JSON.stringify(result, null, 2));

  await db.sequelize.close();
}

associationDemo().catch(console.error);

事务示例

// sequelize-transaction.js
const db = require('./models');

async function transactionDemo() {
  const t = await db.sequelize.transaction();
  try {
    const user = await db.User.create({ username: 'grace', email: 'grace@example.com' }, { transaction: t });
    await db.Post.create({ title: 'Transaction Post', content: 'Using transaction', userId: user.id }, { transaction: t });
    // 提交
    await t.commit();
    console.log('事务提交成功');
  } catch (err) {
    await t.rollback();
    console.error('事务回滚：', err);
  } finally {
    await db.sequelize.close();
  }
}

transactionDemo().catch(console.error);

使用 ORM：TypeORM 示例

TypeORM 是另一个流行的 ORM，尤其在 TypeScript 项目中表现优异。这里以 JavaScript（可扩展到 TS）示例。

7.1 安装与配置

npm install typeorm reflect-metadata mysql2

在 tsconfig.json 中需要启用实验性装饰器和元数据：

{
  "compilerOptions": {
    "experimentalDecorators": true,
    "emitDecoratorMetadata": true,
    "target": "ES2019",
    "module": "commonjs",
    "outDir": "dist",
    "rootDir": "src"
    // …其他选项
  }
}

示例目录：

src/
  entity/
    User.js
  index.js
  ormconfig.json

ormconfig.json

{
  "type": "mysql",
  "host": "localhost",
  "port": 3306,
  "username": "root",
  "password": "123456",
  "database": "test_db",
  "synchronize": true,
  "logging": false,
  "entities": ["src/entity/**/*.js"]
}

7.2 定义实体与数据库同步

示例实体：src/entity/User.js

// src/entity/User.js
const { EntitySchema } = require('typeorm');

module.exports = new EntitySchema({
  name: 'User',
  tableName: 'users',
  columns: {
    id: {
      type: 'int',
      primary: true,
      generated: true
    },
    username: {
      type: 'varchar',
      length: 50,
      unique: true
    },
    email: {
      type: 'varchar',
      length: 100
    },
    createdAt: {
      type: 'timestamp',
      createDate: true
    },
    updatedAt: {
      type: 'timestamp',
      updateDate: true
    }
  }
});

src/index.js

// src/index.js
require('reflect-metadata');
const { createConnection, getRepository } = require('typeorm');

async function main() {
  const connection = await createConnection();
  console.log('已连接到数据库 (TypeORM)');

  const userRepo = getRepository('User');

  // 插入
  const user = userRepo.create({ username: 'hannah', email: 'hannah@example.com' });
  await userRepo.save(user);
  console.log('插入用户：', user);

  // 查询
  const users = await userRepo.find();
  console.log('所有用户：', users);

  // 更新
  user.email = 'hannah_new@example.com';
  await userRepo.save(user);
  console.log('更新用户：', user);

  // 删除
  await userRepo.delete(user.id);
  console.log('删除用户 ID：', user.id);

  await connection.close();
}

main().catch(console.error);

7.3 增删改查示例

在上节代码中，常用操作如下：

repo.create({ … })：生成实体实例
repo.save(entity)：插入或更新（根据主键是否存在）
repo.find()：查询所有记录
repo.findOne({ where: { … } })：条件查询单条
repo.delete(id)：通过主键删除

7.4 关联关系示例

假设有 Post 实体与 User 实体，一对多关系：

src/entity/Post.js

const { EntitySchema } = require('typeorm');

module.exports = new EntitySchema({
  name: 'Post',
  tableName: 'posts',
  columns: {
    id: {
      type: 'int',
      primary: true,
      generated: true
    },
    title: {
      type: 'varchar',
      length: 200
    },
    content: {
      type: 'text'
    }
  },
  relations: {
    author: {
      type: 'many-to-one',
      target: 'User',
      joinColumn: { name: 'userId' },
      inverseSide: 'posts'
    }
  }
});

更新 src/entity/User.js 添加关联：

module.exports = new EntitySchema({
  name: 'User',
  tableName: 'users',
  columns: {
    id: { type: 'int', primary: true, generated: true },
    username: { type: 'varchar', length: 50, unique: true },
    email: { type: 'varchar', length: 100 },
    createdAt: { type: 'timestamp', createDate: true },
    updatedAt: { type: 'timestamp', updateDate: true }
  },
  relations: {
    posts: {
      type: 'one-to-many',
      target: 'Post',
      inverseSide: 'author'
    }
  }
});

更新 src/index.js 查询示例：

// src/index.js
require('reflect-metadata');
const { createConnection, getRepository } = require('typeorm');

async function main() {
  const connection = await createConnection();
  const userRepo = getRepository('User');
  const postRepo = getRepository('Post');

  // 创建用户
  const user = userRepo.create({ username: 'ivan', email: 'ivan@example.com' });
  await userRepo.save(user);

  // 创建文章
  const post = postRepo.create({
    title: 'TypeORM Guide',
    content: 'This is a post using TypeORM.',
    author: user
  });
  await postRepo.save(post);

  // 查询用户及其文章
  const result = await userRepo.findOne({
    where: { id: user.id },
    relations: ['posts']
  });
  console.log('用户及其文章：', JSON.stringify(result, null, 2));

  await connection.close();
}

main().catch(console.error);

常见问题与性能调优

连接超时或频繁断开
- 使用连接池替代单次连接。
- 在生产环境设置合理的 connectionLimit 或 pool 的 idleTimeout。
SQL 注入风险
- 强烈建议使用参数化查询（? 或 $1 语法），不要直接拼接字符串。
OOM / 大结果集拉取
- 对于大量数据，使用分页查询（LIMIT/OFFSET 或基于主键范围查询）。
- Node.js 中对大结果集可使用流式查询（如 mysql2 的 queryStream()）。
事务死锁
- 控制事务粒度，尽量在同一顺序访问表。
- 避免在事务中做长时间操作（如外部 API 调用）。
MongoDB 大数据查询性能
- 创建合适的索引，避免全表扫描；
- 使用聚合管道（aggregation pipeline）代替多次拉取。
ORM 性能开销
- ORM 便于开发，但对于极端性能场景，建议使用原生 SQL；
- 在 Sequelize/TypeORM 中，尽量使用批量操作（bulkCreate、saveMany）减少网络往返。

总结

本文围绕 Node.js 与几种常见数据库（MySQL、PostgreSQL、MongoDB）以及两种主流 ORM 框架（Sequelize、TypeORM）进行了全面介绍：

MySQL 驱动与连接池：包括基础 CRUD、连接池与事务示例。
PostgreSQL 驱动示例：使用 pg 驱动完成类似操作。
MongoDB 官方驱动：完成文档的插入、查询、更新、删除，并说明索引优化思路。
Sequelize ORM：从安装、模型定义、增删改查到事务与关联操作全面举例。
TypeORM 示例：同样展示创建连接、实体定义与关联映射。
性能与常见问题：给出连接超时、注入风险、大结果集处理与事务死锁等优化建议。

通过本文内容，您可以根据实际项目需求选择合适的数据库驱动或 ORM 工具，结合连接池与事务等技术，实现高效、可靠的数据库访问层。同时，图解与代码示例能够帮助您快速理解底层工作原理，并掌握常见坑点与优化思路。

- 阅读更多 -