2025-06-04

MySQL Binlog解析回调中间件：实战实现与深度解析

在分布式系统中，实时监控数据库变化并做增量同步、缓存更新、搜索索引维护等场景非常常见。MySQL Binlog（Binary Log） 作为 MySQL 的二进制日志，记录了所有表的 DML 操作（INSERT/UPDATE/DELETE）以及事务提交信息。通过解析 Binlog，我们可以实时地感知数据变更，触发相应的业务回调，构建“利于扩展”的增量消费管道。

本文将从以下几个方面展开：

Binlog 基础与核心概念
整体架构与中间件定位
核心组件实现与代码示例
数据流及回调流程图解
实战：基于 mysql-binlog-connector-java 的中间件示例
深度解析与进阶优化

全文配合Mermaid 图解、Java 代码示例、详细说明，希望帮助你快速上手 Binlog 回调中间件的设计与实现。

一、Binlog 基础与核心概念

1.1 什么是 Binlog

MySQL Binlog（Binary Log）是 MySQL 写入磁盘的二进制日志文件，用于记录数据库所有更改操作（DML、DDL、事务提交等）。主要用途包括：

主从复制：Slave 从主库拉取并执行 Binlog，实现数据高可用和读写分离。
增量订阅：上游系统（如缓存、搜索引擎）可通过解析 Binlog，实时同步数据变化。
数据审计与回溯：可用于审计、回滚、将来进行数据恢复等场景。

Binlog 由多种事件（Event）组成，主要事件类型有：

FormatDescriptionEvent
Binlog 文件头，描述 Binlog 格式版本、事件头长度等。
RotateEvent
当写入新的 Binlog 文件时，通知从库切换到新文件。
QueryEvent
记录 DDL 或者未使用行格式更新时的查询语句（如 CREATE TABLE、ALTER TABLE、SET NAMES、事务开始/提交）。
TableMapEvent
在行事件（RowEvent）之前，告知该后续事件针对哪个数据库和哪个表，以及列类型、元数据等。
WriteRowsEventV2 / UpdateRowsEventV2 / DeleteRowsEventV2
基于行格式的 DML 事件，分别代表行插入、行更新、行删除。它包含了 TableMapEvent 提供的表结构信息，以及具体行的列值变化。
XidEvent
事务提交事件，对应 COMMIT，告知事务边界，表明之前的行事件属于同一事务。

1.2 行模式(Row-Based)与语句模式(Statement-Based)

MySQL Binlog 有三种记录模式（binlog_format 参数）：

STATEMENT：记录执行的 SQL 语句
ROW：记录行数据变化（以二进制序列化列值方式存储）
MIXED：在某些语句（如非确定性语句）使用行模式，其余使用语句模式

行模式下的每一条 WriteRowsEventV2、UpdateRowsEventV2、DeleteRowsEventV2 都携带行数据的完整列值或变化前后列值（Update）。相比 STATEMENT 模式，行模式解析更简单、数据更精确，但体积略大。现代生产系统通常都采用行模式。

1.3 Binlog 解析方式

常见的 Binlog 解析方式有两种：

使用 MySQL 官方协议
- MySQL Server 提供了复制协议（Replication Protocol），可以像从库一样以 TCP 方式订阅主库 Binlog。
- Java 社区常用 mysql-binlog-connector-java（由 Shyiko 开发）库，模拟从库行为：发起 RegisterSlave、DumpBinlog 等命令，持续拉取 Binlog 并解析 Event。
借助 Canal
- 阿里巴巴开源的 Canal 项目基于 MySQL 的 C++ 复制协议，集群化地解析 Binlog，支持 Kafka、RocketMQ 等发送，并提供 JSON/Avro 等多种序列化格式。
- Canal 已封装了解析与网络层，直接使用其 TCP 接口或 gRPC 接口消费 Binlog 数据。

本文重点演示如何基于 mysql-binlog-connector-java 自行实现一个灵活的 回调中间件，供后续业务注册监听器（Listener）。当然，在实践中也可借鉴 Canal 的思路做二次开发。

二、整体架构与中间件定位

2.1 需求与场景

在微服务、异步解耦、实时同步等场景中，常见需求有：

缓存过期或更新：当某张业务表发生更新时，根据业务规则使缓存失效或更新缓存。
同步到搜索引擎：将新增/更新/删除的行数据同步到 Elasticsearch 或 Solr。
消息异步通知：当某张表发生插入数据时，发送消息到 Kafka/RocketMQ，进一步供下游系统消费。
二次聚合与统计：实时统计某些指标，如订单数、销量等，通过 Binlog 回调计算增量并累积。

为了支持多样化的业务需求，我们需要一个可插拔、轻量、可扩展的中间件层：

统一订阅：单一实例即可连接到 MySQL 主库或主备集群，实时拉取 Binlog。
Topic/Tag 概念：根据数据库名和表名或自定义规则，为不同表变更分配不同“topic”，方便业务注册对应的回调。
Listener 回调机制：开发者可通过注册回调函数（或 Lambda、实现接口），在对应表发生变更时获得行映射与操作类型（insert/update/delete）。
容错与自动恢复：若中间件自身宕机，需保存当前 Binlog 位置（binlog file+position），重启后从上次断点继续。

整体架构示意图如下：

flowchart LR
    subgraph MySQL主库
        A1[Binlog 文件]
    end
    subgraph Binlog客户端中间件
        B1[BinlogConnector] --> B2[事件分发器 Dispatcher]
        B2 --> B3[ListenerRegistry]
        B3 --> Bn[业务回调 Handler]
        B2 --> C1[位点持久化(OffsetStorage)]
    end
    subgraph 业务系统
        D1[缓存服务] 
        D2[ES同步服务]
        D3[消息队列投递]
        D4[统计计算模块]
    end

    A1 --> |复制协议| B1
    B1 --> |解析Event| B2
    B2 --> |分发| D1
    B2 --> |分发| D2
    B2 --> |分发| D3
    B2 --> |分发| D4
    B2 --> |记录当前位点| C1

BinlogConnector：基于 mysql-binlog-connector-java，模拟从库协议拉取 Binlog，解析为 Event 对象。
Dispatcher：根据 Event 类型（TableMap、RowEvent）与表/库信息，构造业务感知的“变更模型”，并分发到对应回调。
ListenerRegistry：维护一个表名→回调列表的映射表，允许业务动态注册/注销。
OffsetStorage：把当前处理到的 Binlog 位点（file name + position）持久化到 MySQL 本地表或 ZooKeeper 等外部存储，以备重启时续传。

三、核心组件实现与代码示例

下面从中间件的主要模块出发，逐步展示核心实现。

3.1 依赖与基础配置

首先，在 pom.xml 中添加必要依赖：

<dependencies>
    <!-- mysql-binlog-connector-java：Binlog 客户端 -->
    <dependency>
        <groupId>com.github.shyiko</groupId>
        <artifactId>mysql-binlog-connector-java</artifactId>
        <version>0.26.0</version>
    </dependency>

    <!-- 日志：Slf4j + Logback -->
    <dependency>
        <groupId>org.slf4j</groupId>
        <artifactId>slf4j-api</artifactId>
        <version>1.7.32</version>
    </dependency>
    <dependency>
        <groupId>ch.qos.logback</groupId>
        <artifactId>logback-classic</artifactId>
        <version>1.2.11</version>
    </dependency>

    <!-- MySQL驱动（用于 OffsetStorage 等场景） -->
    <dependency>
        <groupId>mysql</groupId>
        <artifactId>mysql-connector-java</artifactId>
        <version>8.0.33</version>
    </dependency>

    <!-- 可选：Spring Boot + Spring Data JPA（若使用Spring管理OffsetStorage） -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-data-jpa</artifactId>
    </dependency>
</dependencies>

3.2 BinlogConnector：负责连接与事件拉取

使用 com.github.shyiko.mysql.binlog.BinaryLogClient 作为核心客户端，示例代码如下：

// src/main/java/com/example/binlog/BinlogConnector.java
package com.example.binlog;

import com.github.shyiko.mysql.binlog.BinaryLogClient;
import com.github.shyiko.mysql.binlog.event.*;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.io.IOException;

/**
 * BinlogConnector：包装 BinaryLogClient，负责连接MySQL主库并注册事件监听
 */
public class BinlogConnector {

    private static final Logger logger = LoggerFactory.getLogger(BinlogConnector.class);

    private final BinaryLogClient client;
    private final EventDispatcher dispatcher;

    /**
     * @param host     MySQL主机
     * @param port     MySQL端口
     * @param username 用户名
     * @param password 密码
     * @param registry 事件分发器
     */
    public BinlogConnector(String host, int port, String username, String password, EventDispatcher dispatcher) {
        this.client = new BinaryLogClient(host, port, username, password);
        this.dispatcher = dispatcher;
        // 注册Binlog事件监听器
        this.client.registerEventListener(this::handleEvent);
        // TODO: 可从OffsetStorage读取上次位点，设置 client.setBinlogFilename(...)、client.setBinlogPosition(...)
    }

    /**
     * 启动连接并开始拉取Binlog事件
     */
    public void start() throws IOException {
        logger.info("开始连接MySQL Binlog: {}:{}", client.getHostname(), client.getPort());
        client.connect();
    }

    /**
     * 关闭连接
     */
    public void stop() throws IOException {
        client.disconnect();
    }

    /**
     * 事件处理回调
     */
    private void handleEvent(Event event) {
        EventHeaderV4 header = event.getHeader();
        EventType type = header.getEventType();
        // delegate to dispatcher
        try {
            dispatcher.dispatch(event);
        } catch (Exception e) {
            logger.error("事件分发异常: {}", type, e);
        }
    }

    /**
     * 设置Binlog位点（从OffsetStorage中读取）
     */
    public void setBinlogPosition(String filename, long position) {
        client.setBinlogFilename(filename);
        client.setBinlogPosition(position);
    }
}

BinaryLogClient 会隐式与 MySQL Server 建立复制协议连接，一旦连接成功，就不断拉取 Binlog 事件，并通过 handleEvent 回调暴露 Event 对象。
在 start() 之前，可以通过 setBinlogPosition 恢复上次断点，保证可靠性。

3.3 EventDispatcher：解析 RowEvent 并分发

Binlog 事件中，只有 TableMapEvent + 后续的 RowEvent（WriteRowsEventV2、UpdateRowsEventV2、DeleteRowsEventV2）才真正包含业务数据行信息。其余事件（如 RotateEvent、XidEvent、QueryEvent）可视需求选择性处理或忽略。下面是一个简化的 Dispatcher 实现示例：

// src/main/java/com/example/binlog/EventDispatcher.java
package com.example.binlog;

import com.github.shyiko.mysql.binlog.event.*;
import com.github.shyiko.mysql.binlog.event.deserialization.EventDeserializer;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.util.*;

/**
 * EventDispatcher：负责维护表（db.table）到Listener列表的映射，并将RowEvent转换为业务模型后调用回调
 */
public class EventDispatcher {

    private static final Logger logger = LoggerFactory.getLogger(EventDispatcher.class);

    /** key: dbName.tableName, value: list of listeners */
    private final Map<String, List<RowEventListener>> listenerMap = new HashMap<>();

    /** 临时保存上一次 TableMapEvent 信息：Event 下的表ID->(dbName, tableName, columnMeta) 映射 */
    private final Map<Long, TableMapEventData> tableMap = new HashMap<>();

    /**
     * 注册回调
     * @param dbName    数据库名
     * @param tableName 表名
     * @param listener  监听器
     */
    public void register(String dbName, String tableName, RowEventListener listener) {
        String key = generateKey(dbName, tableName);
        listenerMap.computeIfAbsent(key, k -> new ArrayList<>()).add(listener);
        logger.info("注册 Binlog 回调: {}", key);
    }

    /**
     * 注销回调
     */
    public void unregister(String dbName, String tableName, RowEventListener listener) {
        String key = generateKey(dbName, tableName);
        List<RowEventListener> list = listenerMap.get(key);
        if (list != null) {
            list.remove(listener);
        }
    }

    /**
     * 分发 Event，解析后调用对应listener
     */
    public void dispatch(Event event) {
        EventType type = event.getHeader().getEventType();
        EventData data = event.getData();

        switch (type) {
            case TABLE_MAP:
                TableMapEventData tmData = (TableMapEventData) data;
                // 缓存 TableMapEventData，以供后续RowEvent使用
                tableMap.put(tmData.getTableId(), tmData);
                break;

            case EXT_WRITE_ROWS:
            case WRITE_ROWS:
                processWriteRows((WriteRowsEventData) data);
                break;

            case EXT_UPDATE_ROWS:
            case UPDATE_ROWS:
                processUpdateRows((UpdateRowsEventData) data);
                break;

            case EXT_DELETE_ROWS:
            case DELETE_ROWS:
                processDeleteRows((DeleteRowsEventData) data);
                break;

            // 可以根据需求处理XID/QUERY/ROTATE/CUSTOM等事件
            default:
                // logger.debug("忽略Event: {}", type);
                break;
        }
    }

    private void processWriteRows(WriteRowsEventData data) {
        long tableId = data.getTableId();
        TableMapEventData tmd = tableMap.get(tableId);
        if (tmd == null) {
            logger.warn("无法找到 TableMapEventData for tableId={}", tableId);
            return;
        }
        String key = generateKey(tmd.getDatabase(), tmd.getTable());
        List<RowEventListener> listeners = listenerMap.get(key);
        if (listeners == null || listeners.isEmpty()) {
            return;
        }
        // each row is an Object[] of column values
        for (Object[] row : data.getRows()) {
            RowData rowData = new RowData(tmd.getDatabase(), tmd.getTable(), RowEventType.INSERT, row, null);
            listeners.forEach(l -> l.onEvent(rowData));
        }
    }

    private void processUpdateRows(UpdateRowsEventData data) {
        long tableId = data.getTableId();
        TableMapEventData tmd = tableMap.get(tableId);
        if (tmd == null) {
            logger.warn("无法找到 TableMapEventData for tableId={}", tableId);
            return;
        }
        String key = generateKey(tmd.getDatabase(), tmd.getTable());
        List<RowEventListener> listeners = listenerMap.get(key);
        if (listeners == null || listeners.isEmpty()) {
            return;
        }
        for (Map.Entry<Serializable[], Serializable[]> entry : data.getRows()) {
            RowData rowData = new RowData(tmd.getDatabase(), tmd.getTable(), RowEventType.UPDATE, entry.getValue(), entry.getKey());
            listeners.forEach(l -> l.onEvent(rowData));
        }
    }

    private void processDeleteRows(DeleteRowsEventData data) {
        long tableId = data.getTableId();
        TableMapEventData tmd = tableMap.get(tableId);
        if (tmd == null) {
            logger.warn("无法找到 TableMapEventData for tableId={}", tableId);
            return;
        }
        String key = generateKey(tmd.getDatabase(), tmd.getTable());
        List<RowEventListener> listeners = listenerMap.get(key);
        if (listeners == null || listeners.isEmpty()) {
            return;
        }
        for (Object[] row : data.getRows()) {
            RowData rowData = new RowData(tmd.getDatabase(), tmd.getTable(), RowEventType.DELETE, null, row);
            listeners.forEach(l -> l.onEvent(rowData));
        }
    }

    private String generateKey(String db, String table) {
        return db + "." + table;
    }
}

3.3.1 重要点说明

缓存 TableMapEvent：由于 RowEvent 仅包含 tableId，而不直接带库表名，因此在接收到 TableMapEvent 时，需要将 tableId -> (dbName, tableName, columnMeta) 缓存下来，供后续 RowEvent 使用。

RowData 模型：定义了一个简单的 POJO 来表示行变更数据，其中包含：

public class RowData {
    private final String database;
    private final String table;
    private final RowEventType eventType; // INSERT/UPDATE/DELETE
    private final Object[] newRow;        // 更新后数据或插入数据
    private final Object[] oldRow;        // 更新前数据或删除数据

    // + 构造方法、Getter
}

RowEventListener：一个接口，业务只需实现该接口的 onEvent(RowData rowData) 方法即可。例如：
```
public interface RowEventListener {
    void onEvent(RowData rowData);
}
```
分发逻辑：
- INSERT：WriteRowsEventData.getRows() 返回多行，每行是一个 Object[]，代表插入行的所有列值。回调时 oldRow=null, newRow=row。
- UPDATE：UpdateRowsEventData.getRows() 返回 List<Entry<oldRow, newRow>>，代表更新前后列值。回调时 oldRow=entry.getKey(), newRow=entry.getValue()。
- DELETE：DeleteRowsEventData.getRows() 返回多行已删除的行列值，newRow=null, oldRow=row。

3.4 OffsetStorage：持久化位点（可选多种实现）

为保证中间件在重启后能够从上次中断的 Binlog 位点（binlog file + position）处继续解析，需要把当前已消费的位点持久化。常见做法有：

本地文件
MySQL 专用元数据表
ZooKeeper
Redis

下面示例以MySQL 元数据表为例，演示一个简单实现。

// src/main/java/com/example/binlog/OffsetStorage.java
package com.example.binlog;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.sql.*;

/**
 * OffsetStorage：将当前 binlog 位点持久化到 MySQL 表中
 */
public class OffsetStorage {

    private static final Logger logger = LoggerFactory.getLogger(OffsetStorage.class);

    private final String jdbcUrl;
    private final String username;
    private final String password;

    public OffsetStorage(String jdbcUrl, String username, String password) {
        this.jdbcUrl = jdbcUrl;
        this.username = username;
        this.password = password;
        // 初始化表结构
        initTable();
    }

    private void initTable() {
        try (Connection conn = DriverManager.getConnection(jdbcUrl, username, password);
             Statement stmt = conn.createStatement()) {
            stmt.executeUpdate("CREATE TABLE IF NOT EXISTS binlog_offset (" +
                    "id INT PRIMARY KEY AUTO_INCREMENT," +
                    "binlog_file VARCHAR(255) NOT NULL," +
                    "binlog_pos BIGINT NOT NULL," +
                    "ts TIMESTAMP DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP" +
                    ")");
        } catch (SQLException e) {
            logger.error("初始化 binlog_offset 表失败", e);
        }
    }

    /**
     * 保存 binlog 位点
     */
    public void saveOffset(String file, long pos) {
        try (Connection conn = DriverManager.getConnection(jdbcUrl, username, password);
             PreparedStatement pstmt = conn.prepareStatement(
                     "INSERT INTO binlog_offset (binlog_file, binlog_pos) VALUES (?, ?)")) {
            pstmt.setString(1, file);
            pstmt.setLong(2, pos);
            pstmt.executeUpdate();
        } catch (SQLException e) {
            logger.error("保存 binlog 位点失败", e);
        }
    }

    /**
     * 获取最新的 binlog 位点
     */
    public BinlogPosition loadLatestOffset() {
        try (Connection conn = DriverManager.getConnection(jdbcUrl, username, password);
             Statement stmt = conn.createStatement()) {
            ResultSet rs = stmt.executeQuery(
                    "SELECT binlog_file, binlog_pos FROM binlog_offset ORDER BY id DESC LIMIT 1");
            if (rs.next()) {
                return new BinlogPosition(rs.getString(1), rs.getLong(2));
            }
        } catch (SQLException e) {
            logger.error("加载 binlog 位点失败", e);
        }
        return null;
    }
}

// src/main/java/com/example/binlog/BinlogPosition.java
package com.example.binlog;

/**
 * 简单的 binlog 位点模型
 */
public class BinlogPosition {
    private final String fileName;
    private final long position;

    public BinlogPosition(String fileName, long position) {
        this.fileName = fileName;
        this.position = position;
    }

    public String getFileName() {
        return fileName;
    }

    public long getPosition() {
        return position;
    }
}

在中间件启动时，通过 loadLatestOffset 获取上次位点，并传给 BinlogConnector.setBinlogPosition(...)。
在解析到每个事件后（例如接收到 XidEvent 或每若干行事件后），都可以调用 saveOffset 保存当前 client.getBinlogFilename() 与 client.getBinlogPosition()。

3.5 业务使用示例

下面演示一个简单的业务代码示例：当 test.user 表发生任何 DML 变更时，打印行数据或将其同步到缓存。

// src/main/java/com/example/demo/UserChangeListener.java
package com.example.demo;

import com.example.binlog.RowData;
import com.example.binlog.RowEventListener;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

/**
 * 业务Listener：监听 test.user 表的增删改事件
 */
public class UserChangeListener implements RowEventListener {

    private static final Logger logger = LoggerFactory.getLogger(UserChangeListener.class);

    @Override
    public void onEvent(RowData rowData) {
        String db = rowData.getDatabase();
        String table = rowData.getTable();
        switch (rowData.getEventType()) {
            case INSERT:
                logger.info("[INSERT] {}.{} -> {}", db, table, arrayToString(rowData.getNewRow()));
                // TODO: 将 rowData.getNewRow() 同步到缓存/ES/Kafka
                break;
            case UPDATE:
                logger.info("[UPDATE] {}.{} -> OLD={} , NEW={}",
                        db, table, arrayToString(rowData.getOldRow()), arrayToString(rowData.getNewRow()));
                // TODO: 更新缓存/ES
                break;
            case DELETE:
                logger.info("[DELETE] {}.{} -> {}", db, table, arrayToString(rowData.getOldRow()));
                // TODO: 从缓存/ES删除该数据
                break;
        }
    }

    private String arrayToString(Object[] arr) {
        if (arr == null) return "null";
        StringBuilder sb = new StringBuilder("[");
        for (Object o : arr) {
            sb.append(o).append(",");
        }
        if (sb.length() > 1) sb.deleteCharAt(sb.length() - 1);
        sb.append("]");
        return sb.toString();
    }
}

结合上述模块，即可在 main 方法中搭建完整的中间件示例：

// src/main/java/com/example/demo/BinlogMiddlewareApplication.java
package com.example.demo;

import com.example.binlog.*;

public class BinlogMiddlewareApplication {

    public static void main(String[] args) throws Exception {
        // 1. 创建 OffsetStorage，从MySQL表读取上次位点
        OffsetStorage offsetStorage = new OffsetStorage(
                "jdbc:mysql://127.0.0.1:3306/test?useSSL=false&useUnicode=true&characterEncoding=UTF-8",
                "root", "root_password"
        );
        BinlogPosition lastPos = offsetStorage.loadLatestOffset();

        // 2. 创建 EventDispatcher 并注册业务 Listener
        EventDispatcher dispatcher = new EventDispatcher();
        dispatcher.register("test", "user", new UserChangeListener());

        // 3. 创建 BinlogConnector 并设定起始位点
        BinlogConnector binlogConnector = new BinlogConnector(
                "127.0.0.1", 3306, "repl_user", "repl_password", dispatcher
        );
        if (lastPos != null) {
            binlogConnector.setBinlogPosition(lastPos.getFileName(), lastPos.getPosition());
        }

        // 4. 启动客户端
        binlogConnector.start();

        // 5. 在另一个线程周期性保存位点
        new Thread(() -> {
            while (true) {
                try {
                    Thread.sleep(5000);
                    String currentFile = binlogConnector.client.getBinlogFilename();
                    long currentPos = binlogConnector.client.getBinlogPosition();
                    offsetStorage.saveOffset(currentFile, currentPos);
                } catch (Exception e) {
                    e.printStackTrace();
                }
            }
        }, "OffsetSaver").start();
    }
}

说明
repl_user：需要在 MySQL 中创建一个具有 REPLICATION SLAVE 权限的用户，否则无法订阅 Binlog。
Offset 保存线程：为了防止频繁保存，可根据业务需求调整保存策略，例如在每次执行 XidEvent（事务提交时）后再保存。

四、数据流及回调流程图解

为便于理解整个流程，下面用 Mermaid 演示从连接、Event 拉取到回调的关键步骤。

sequenceDiagram
    participant Middleware as Binlog中间件
    participant MySQL as MySQL主库
    participant OffsetStorage as 位点存储
    participant Business as 业务Listener

    Note over Middleware: 启动时读取上次位点
    Middleware->>OffsetStorage: loadLatestOffset()
    OffsetStorage-->>Middleware: 返回 (file, pos)

    Note over Middleware: 连接Binlog
    Middleware->>MySQL: COM_REGISTER_SLAVE + COM_BINLOG_DUMP_AT_POS
    MySQL-->>Middleware: 返回 Binlog 格式描述

    loop 持续拉取
        MySQL-->>Middleware: BinlogEvent (TableMapEvent)
        Middleware->>Dispatcher: dispatch(TableMapEvent)
        Note right of Dispatcher: 缓存 tableId->tableMeta

        MySQL-->>Middleware: BinlogEvent (WriteRows/Event)
        Middleware->>Dispatcher: dispatch(WriteRowsEvent)
        Dispatcher->>Listener: onEvent(RowData)
        Business-->>Dispatcher: 业务处理

        MySQL-->>Middleware: BinlogEvent (XidEvent)
        Middleware->>Dispatcher: dispatch(XidEvent)
        Note right of Dispatcher: 标记事务完成
        Dispatcher->>OffsetStorage: saveOffset(currentFile, currentPos)
    end

启动阶段：中间件从 OffsetStorage（如 MySQL 本地表）获取上次正确处理的 Binlog 位点，调用 BinaryLogClient.setBinlogFilename/Position 恢复状态。
连接阶段：向 MySQL 主库发起 COM_REGISTER_SLAVE，然后发送 COM_BINLOG_DUMP_AT_POS，请求从指定位置拉取 Binlog。
解析阶段：
1. TableMapEvent：更新本地 tableMap 缓存，用于 RowEvent 解析时知道具体库表及字段元数据。
2. RowEvent：封装为 RowData 并调用所有注册的 RowEventListener，进行业务回调。
3. XidEvent：事务提交，此时认为已收到完整的事务操作，持久化当前 Binlog 位点。

五、深度解析与进阶优化

在初步实现一个可工作的 Binlog 回调中间件后，还需关注下列几个进阶问题，以提高稳定性、性能与可扩展性。

5.1 数据可靠性与事务完整性

事务边界感知：
- 我们在接收到 XidEvent 后保存位点，表示整个事务已经完整消费。如果在某个事务中途中间件崩溃，重启后只会从上一次提交的位点开始，避免部分行更新被重复或漏处理。
幂等处理：
- RowEventListener 应保证回调业务的幂等性。即使同一行事件被多次回调，也能避免产生脏数据。通常做法：业务数据打唯一索引或先检查再插入/更新。

5.2 高吞吐与性能优化

批量分发与异步处理
- 对于高并发场景，每行的回调业务耗时较长时，可采用“将多个 RowData 缓存到队列，再由线程池异步处理”的方式，减少对主线程（Binlog 读取线程）的阻塞。例如：
```
// Dispatcher 内部持有一个 BlockingQueue<RowData>
// 启动 N 个 Worker 线程，从队列中 fetch并调用 Listener
```
- 也可按事务（XidEvent）边界，收集本次事务的所有 RowData，一次性打包给业务线程处理。
并发解析：多线程消费
- 默认 BinaryLogClient 会在单个线程里拉取并调用 EventListener。若需要更高并发，可考虑在 dispatch 方法里把不同表、不同分区的 RowData 分发到不同线程处理，但需注意事务顺序一致性：同一张表的多个更新需要保证顺序处理。
- 建议方案：为每个表（或业务分组）维护一个串行队列，其内部保证顺序；并为不同表或分库做多路并行消费。
连接隔离
- 若要避免业务对解析线程的影响，可把“解析”与“回调”分离，即：
  1. 解析线程：单线程或少量线程专门拉取并解析 Binlog，将 RowData 投递到一个内存队列。
  2. 回调线程池：从这个队列消费 RowData 并执行业务。
- 分离后，即使回调逻辑卡顿，也不会阻塞 Binlog 拉取，可有效避免积压导致内存暴增。

5.3 多实例与水平扩展

当业务量增大，一个实例无法满足处理能力时，需要水平扩展成 N 个中间件实例并行消费。常见做法：

基于表分片
- 把需要监听的表分组，让不同实例监听不同表。例如：实例 A 监听 order 表，实例 B 监听 user 表，互不打扰。
- 如果同一张表只能被一个实例消费，避免重复消费或竞态。
基于位点分片（不推荐）
- 理论上可以让实例 A 处理 Binlog 文件前半段，实例 B 处理后半段，但 Binlog 是流式文件，分片很难保证事务完整性，且会导致每个实例都要从头读到指定位置，效率低。
与 MySQL Group Replication 结合
- 多个 MySQL 实例做主主复制时，只需要把 Binlog 中间件连接到其中一个主，保证它能读到所有事件即可。若主宕机，其余节点可继续提供 Binlog。
使用 ZooKeeper 选主
- 如果想让 N 个中间件实例只保留一个实例作为“主”去消费 Binlog，可用 ZooKeeper 做简单 Leader 选举。主实例跑 BinaryLogClient，其余实例闲置，仅监控状态。主故障或网络分区后自动让备实例接替，保证零中断。

5.4 元数据同步与 Schema 变更处理

Schema 演进兼容
- 当表结构（如新增列、删除列）发生变化时，TableMapEvent 会携带最新的列元数据（含列名、类型、长度等）。Dispatcher 需要及时更新 tableMap 缓存，并在回调时将 RowData 映射成业务模型（如 Map<列名, 值>）。示例：
```
// 在 TableMapEventData 中存储列名列表 columns
String[] columnNames = tmd.getColumnNames();
// 在 RowData 中提供 Map<String, Object> 形式的访问
Map<String, Object> rowMap = new LinkedHashMap<>();
for (int i = 0; i < columnNames.length; i++) {
    rowMap.put(columnNames[i], row[i]);
}
```
- 若部分业务只关心某些列，可在注册 Listener 时指定感兴趣列，Dispatcher 在填充 rowMap 时进行过滤，减少内存占用与拷贝开销。
动态增加/删除 Listener
- 生产环境中可能希望在运行时动态注册新表 Listener 或取消某些 Listener，避免对中间件重启。ListenerRegistry 设计要支持线程安全的注册/注销。
- 并在 dispatch 时使用读写锁或CopyOnWriteList 来保证并发安全。

六、完整示例回顾与测试

下面对前文示例进行一个完整回顾，并提供一个简单的集成测试思路，帮助你验证中间件能正确消费并回调。

6.1 完整代码结构

binlog-middleware/
├── pom.xml
└── src
    └── main
        ├── java
        │   └── com.example.binlog
        │       ├── BinlogConnector.java
        │       ├── EventDispatcher.java
        │       ├── OffsetStorage.java
        │       ├── RowData.java
        │       ├── RowEventListener.java
        │       ├── BinlogPosition.java
        │       └── RowEventType.java
        └── resources
            └── application.properties (若使用Spring管理OffsetStorage)
    └── test
        └── java
            └── com.example.demo
                ├── UserChangeListenerTest.java
                └── BinlogMiddlewareApplicationTest.java

6.2 集成测试思路

准备测试环境

本地或 Docker 启动一个单节点 MySQL，开启 Binlog 行模式：
```
SET GLOBAL log_bin = 'mysql-bin';
SET GLOBAL binlog_format = 'ROW';
```

在 MySQL 中创建测试表：

CREATE DATABASE IF NOT EXISTS test;
USE test;
CREATE TABLE IF NOT EXISTS user (
    id BIGINT PRIMARY KEY AUTO_INCREMENT,
    name VARCHAR(50),
    age INT,
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);

创建一个具有 REPLICATION SLAVE 权限的用户：

CREATE USER 'repl_user'@'%' IDENTIFIED BY 'repl_pass';
GRANT REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'repl_user'@'%';
FLUSH PRIVILEGES;

编写测试用例

在测试代码中，先启动 BinlogMiddlewareApplication，让它订阅 test.user 表。
然后通过 JDBC 插入、更新、删除几条数据，观察 UserChangeListener 有没有打印正确的回调日志。

例如：

// UserChangeListenerTest.java
@RunWith(SpringRunner.class)
@SpringBootTest(classes = BinlogMiddlewareApplication.class)
public class UserChangeListenerTest {

    @Autowired
    private DataSource dataSource; // 用于执行测试DML

    @Test
    public void testInsertUpdateDelete() throws Exception {
        // 插入
        try (Connection conn = dataSource.getConnection();
             Statement stmt = conn.createStatement()) {
            stmt.execute("INSERT INTO test.user (name, age) VALUES ('Alice', 30)");
        }
        // 等待几秒让Binlog中间件消费
        Thread.sleep(2000);

        // 更新
        try (Connection conn = dataSource.getConnection();
             Statement stmt = conn.createStatement()) {
            stmt.execute("UPDATE test.user SET age=31 WHERE name='Alice'");
        }
        Thread.sleep(2000);

        // 删除
        try (Connection conn = dataSource.getConnection();
             Statement stmt = conn.createStatement()) {
            stmt.execute("DELETE FROM test.user WHERE name='Alice'");
        }
        Thread.sleep(2000);

        // 验证日志或回调是否真正执行（可通过外部Collector或Mocking机制检查）
    }
}

检查 Offset 持久化
- 验证 binlog_offset 表中是否有记录最新的 binlog_file 和 binlog_pos，并且随事件变化不断更新。
- 模拟中间件重启：在插入一定数据后，停止中间件进程，再插入更多数据，再次重启，确认回调处理中间件只能消费新插入的数据，而不会漏掉或重复消费之前已处理的。

七、小结

Binlog 回调中间件的必要性
- 基于 Binlog 构建增量消费管道，可为缓存更新、搜索索引、异步消息等多种场景提供实时、可靠的数据源。
- 通过“注册回调 Listener”模式，使业务代码与底层解析逻辑解耦，易于维护与扩展。
核心思路
- 使用 mysql-binlog-connector-java 模拟从库协议，拉取 Binlog。
- 缓存 TableMapEvent 中的表结构信息，解析后续行事件。
- 将行事件封装成 RowData，调用业务回调。
- 持久化 binlog file + position，保证中间件重启后能从断点续传。
进阶优化
- 考虑批量异步处理与线程池隔离，避免回调业务阻塞解析线程。
- 根据业务复杂度进行多实例扩展或 Leader 选举机制，保证高可用与顺序一致性。
- 动态感知表结构变化，实现 Schema 演进兼容。
实践建议
- 幂等性：所有回调业务都应保证幂等，否则 Binlog 中间件重启后可能导致重复消费。
- 事务完整性：在 XidEvent 收到后再做 Offset 持久化，避免半事务数据丢失。
- 监控与报警：关注中间件与 MySQL 连接状态，必要时加入心跳机制，确保第一时间发现断线重连。
- 版本升级：若 MySQL 升级到 8.0+ 或使用 GTID，需测试 mysql-binlog-connector-java 的兼容性，或考虑 Debezium 等更成熟方案。

通过本文示例与深入解析，相信你已经对 MySQL Binlog 解析回调中间件 的原理与实战实现有了清晰的理解。后续可结合具体业务场景，做更多自定义扩展，例如：消息序列化、Kafka/SquidMQ 推送、精准过滤与动态路由等，打造真正适合自身系统需求的增量消费中间件。

- 阅读更多 -

分布式系统中的一致性保障：深入探索MySQL XA协议‌

System

2025-06-01

所有,mysql,分布式

MySQL XA 协议示意图

分布式系统中的一致性保障：深入探索MySQL XA协议

一、引言

在分布式系统中，事务的原子性和一致性尤为关键。当业务需要跨多个数据库实例执行操作时，需要一种能够跨资源管理器（Resource Manager, RM）协调提交或回滚的机制。MySQL 提供了 XA（eXtended Architecture）协议实现了符合 X/Open XA 规范的分布式事务管理能力，本文将深度解析 MySQL XA 协议的原理、流程，并结合示意图与代码示例，帮助读者快速掌握其实现与使用方法。

二、XA 协议概览

XA 规范由 X/Open（现为 The Open Group）定义，用于跨多个参与者管理全局事务。MySQL 从 5.0 开始支持 XA。其关键思想是将全局事务拆分为以下阶段：

分布式事务开始 (XA START / XA OPEN)
全局事务管理器（Transaction Manager, TM）告诉各个参与者 (RM) 准备接受全局事务下的操作。
分布式事务预备 (XA END + XA PREPARE)
各 RM 执行本地事务并把结果 “预备” 在本地缓冲区，进入准备提交状态，不做最终提交或回滚。RM 返回准备确认 (XA PREPARE\_OK)。
分布式事务提交或回滚 (XA COMMIT / XA ROLLBACK)
根据预备阶段是否所有参与者都返回成功，TM 发出全局提交或全局回滚命令，各 RM 做最终提交或回滚操作，并反馈给 TM 确认结束。

以上三阶段保证了分布式事务的原子性与一致性。

三、XA 协议流程详解

下面结合上方示意图，逐步说明 MySQL XA 协议的执行流程。

3.1 三个参与者示意图说明

在图中，有 4 个主要节点：

Client（客户端）：发起全局事务的程序。
Transaction Manager（TM，全局事务管理器）：负责协调 XA 分布式事务的协调者。
Resource Manager 1 / 2（RM1, RM2，本地 MySQL 实例）：负责执行本地事务（例如写入某张表）并参与 XA 协议。

3.2 阶段一：XA START / XA OPEN

Client → TM：BEGIN TRANSACTION
客户端告诉 TM 准备发起一个分布式事务。
TM → RM1, RM2：XA OPEN
TM 向每个 RM 发送 XA START 'xid'，其中 xid 是全球唯一的事务标识符，例如 "gtrid:formatid:branchid"。
RM1, RM2：本地开始事务
各自进入 XA 模式，开始记录在此全局事务下的操作。

3.3 阶段二：XA END + XA PREPARE

Client → TM：发起各项更新/插入等操作
客户端通过 TM 或直接在每个 RM 上执行 DML 操作。示意图中，TM 先发起 XA END 表示本地更新操作完成，进入可预备状态。
TM → RM1, RM2：XA END
向各参与者发送 XA END 'xid'，告诉其不再接收新的 DML，准备执行预备阶段。
TM → RM1, RM2：XA PREPARE
TM 依次向各参与者发送 XA PREPARE 'xid'，使各参与者将当前事务在本地写入 redo log，但尚未真正做 commit，仅仅保证如果收到后续提交命令可以恢复提交。
RM1, RM2 → TM：XA PREPARE\_OK / 错误
各参与者执行 PREPARE，若本地事务操作成功且记录日志成功，则返回准备完成 (OK)；否则返回错误，触发后续回滚。

3.4 阶段三：XA COMMIT / XA ROLLBACK

TM 判断阶段二所有参与者返回状态
- 如果所有 RM 返回 OK，TM 发送 XA COMMIT 'xid'：全局提交；
- 如果有任一 RM 返回错误，TM 发送 XA ROLLBACK 'xid'，进行全局回滚。
RM1, RM2：执行 final 提交或回滚
- 提交：各自将之前预备的本地事务写入磁盘并释放锁；
- 回滚：各自丢弃预备日志并撤销已执行的本地操作（若已写入，则根据 undo log 回退）。
RM → TM：ACK\_COMMIT / ACK\_ROLLBACK
各参与者告知 TM 已安全完成提交或回滚。至此，全局事务结束。

四、XA 关键命令与用法示例

下面给出 MySQL 客户端中常用的 XA 命令示例，演示一个简单的跨库分布式事务场景。

4.1 环境假设

有两台 MySQL 实例：db1 (端口 3306) 和 db2 (端口 3307)。

两个数据库中各有 accounts 表：

-- 在 db1 中：
CREATE TABLE accounts (
    id INT PRIMARY KEY AUTO_INCREMENT,
    balance DECIMAL(10,2)
);
INSERT INTO accounts (balance) VALUES (1000.00);

-- 在 db2 中：
CREATE TABLE accounts (
    id INT PRIMARY KEY AUTO_INCREMENT,
    balance DECIMAL(10,2)
);
INSERT INTO accounts (balance) VALUES (500.00);

4.2 脚本示例：跨库转账 100 元

-- 在 MySQL 客户端或脚本中执行以下步骤：

-- 1. 生成全局事务 ID (XID)
SET @xid = 'myxid-123';

-- 2. 在 db1 （RM1）上启动 XA
XA START @xid;
UPDATE accounts SET balance = balance - 100.00 WHERE id = 1;
XA END @xid;

-- 3. 在 db2 （RM2）上启动 XA
XA START @xid;
UPDATE accounts SET balance = balance + 100.00 WHERE id = 1;
XA END @xid;

-- 4. 向两个实例发送 XA PREPARE
XA PREPARE @xid;     -- 在 db1 上执行
-- 返回 'OK' 或错误

XA PREPARE @xid;     -- 在 db2 上执行
-- 返回 'OK' 或错误

-- 5. 如果 db1、db2 均返回 OK，执行全局提交；否则回滚
-- 假设两个 PREPARE 都成功：
XA COMMIT @xid;      -- 在 db1 上执行，真正提交
XA COMMIT @xid;      -- 在 db2 上执行，真正提交

-- 6. 若某一侧 PREPARE 失败，可执行回滚
-- XA ROLLBACK @xid;  -- 在失败或任意一侧准备失败时执行

说明：
XA START 'xid'：启动 XA 本地分支事务；
DML 更新余额后执行 XA END 'xid'，告知不再有 DML；
XA PREPARE 'xid'：进入预备阶段，将数据写入 redo log，并保证能在后续阶段恢复；
XA COMMIT 'xid'：真正提交；对参与者而言，相当于将预备日志提交；否则使用 XA ROLLBACK 'xid' 回滚。

五、XA 协议中的故障场景与恢复

在分布式环境中，常见故障包括网络抖动、TM 异常、某个 RM 宕机等。XA 协议设计提供了在异常场景下可恢复的机制。

5.1 TM 崩溃或网络故障

如果在阶段二 (XA PREPARE) 后，TM 崩溃，没有下发 XA COMMIT 或 XA ROLLBACK，各 RM 会保持事务挂起状态。
恢复时，TM 管理器需从持久化记录（或通过外部日志）获知全局 XID，并向所有 RM 发起后续的 XA RECOVER 调用，查询哪些还有待完成的事务分支，再根据实际情况发送 XA COMMIT/ROLLBACK。

5.2 某个 RM 宕机

如果在阶段二之前 RM 宕机，TM 在发送 XA PREPARE 时可立即感知错误，可选择对全局事务进行回滚。
如果在已发送 XA PREPARE 后 RM 宕机，RM 重启后会有未完成的预备分支事务。TM 恢复后可使用 XA RECOVER 命令在 RM 上查询 “prepared” 状态的 XID，再决定 COMMIT 或 ROLLBACK。

5.3 应用 `XA RECOVER` 命令

-- 在任意 RM 中执行：
XA RECOVER;
-- 返回所有处于预备阶段（PREPARED）的事务 XID 列表：
-- | gtrid formatid branchid |
-- | 'myxid-123'        ...   |

TM 可对返回的 XID 列表进行检查，逐一发送 XA COMMIT XID（或回滚）。

六、XA 协议示意图解

上方已通过图示展示了 XA 协议三阶段的消息流，包括：

XA START / END：TM 先告知 RM 进入事务上下文，RM 执行本地操作；
XA PREPARE：TM 让 RM 将本地事务置为“准备”状态；
XA COMMIT / ROLLBACK：TM 根据所有 RM 的准备结果下发最终提交或回滚命令；

通过图中箭头与阶段标注，可以清晰看出三个阶段的流程，以及每个参与者在本地的操作状态。

七、XA 协议实现细节与优化

7.1 XID 结构和唯一性

MySQL 的 XID 格式为三元组：gtrid:formatid:branchid。
- gtrid（全局事务 ID）：标识整个全局事务；
- formatid：可选字段，用于区分不同 TM 或不同类型事务；
- branchid（分支事务 ID）：标识当前 RM 上的分支。
例如：'myxid:1:1' 表示 gtrid=myxid、formatid=1、branchid=1。TM 在不同 RM 上启动分支时，branchid 应唯一，例如 branchid=1 对应 RM1，branchid=2 对应 RM2。

7.2 事务日志与持久化

在 XA PREPARE 时，RM 会将事务的修改写入日志（redo log），并保证在崩溃重启后可恢复。
XA COMMIT 或 XA ROLLBACK 时，RM 则根据日志进行持久化提交或回退。
如果底层存储出现故障而日志无法刷盘，RM 会返回错误，TM 根据错误状态进行回滚。

7.3 并发事务与并行提交

不同全局事务间并发执行并不互相阻塞，但同一个分支在未 XA END 之前无法调用 XA START 再次绑定新事务。
TM 可并行向多个 RM 发出 PREPARE 和 COMMIT 请求。若某些 RM 响应较慢，会阻塞后续全局事务或其补偿逻辑。
在大规模分布式环境，推荐引入超时机制：如果某个 RM 在可接受时间内未回应 PREPARE_OK，TM 可选择直接发起全局回滚。

7.4 分布式事务性能考量

XA 协议涉及多次网络通信（START→END→PREPARE→COMMIT），延迟较高，不适合写操作频繁的高并发场景。
对于读多写少、或对一致性要求极高的场景，XA 是可选方案；否则可考虑：
- 最终一致性架构 (Saga 模式)：将长事务拆分为多个本地短事务并编排补偿操作；
- 基于消息队列的事务（Outbox Pattern）：通过消息中间件保证跨库写入顺序与一致性，降低分布式锁和两阶段提交带来的性能损耗。

八、实践建议与总结

合理设置 XA 超时与重试机制
- 在高可用场景中，为 XA START、XA PREPARE、XA COMMIT 设置合理超时，避免 RM 卡死；
- 对于 XA COMMIT 或 XA ROLLBACK 失败的 XID，可通过定期脚本（cronjob）扫描并重试。
监控 XA RECOVER 状态
- 定期在各 RM 上执行 XA RECOVER，定位处于 PREPARED 状态未处理的 XID 并补偿；
- 在监控系统中配置告警，当累计挂载 XID 数量过多时触发运维介入。
权衡一致性与性能
- 由于 XA 带来显著的性能开销，应仅在对强一致性要求严格且写操作量相对有限时使用。
- 对于需要高吞吐的场景，可考虑基于微服务化架构下的 Saga 模式或消息驱动最终一致性。

参考示意图：上方“图：MySQL XA协议三阶段示意图”展示了 XA START、XA END、XA PREPARE、XA COMMIT 等命令在 TM 与各 RM 之间的交互流程，清晰呈现了三阶段提交的核心机制。

通过本文对 MySQL XA 协议原理、命令示例、故障恢复及优化思考的全面解析，相信能帮助您在分布式系统中设计与实现稳健的一致性解决方案。愿本文对您深入理解与应用 XA 协议有所助益！

- 阅读更多 -

【MySQL】库操作，数据类型

System

2024-09-04

所有,mysql

在MySQL中，数据类型是一个非常重要的概念，因为它定义了数据的种类，决定了可以在这种数据上进行哪些操作。MySQL支持多种数据类型，包括数值型、日期型、字符串型等。

以下是一些常见的数据类型以及它们的用法：

整数类型：

TINYINT
SMALLINT
MEDIUMINT
INT, INTEGER
BIGINT

例如，创建一个名为"users"的表，并包含一个TINYINT类型的列"age"：




CREATE TABLE users (
    id INT PRIMARY KEY,
    age TINYINT
);

浮点数类型：

FLOAT
DOUBLE
DECIMAL

例如，创建一个名为"products"的表，并包含一个DECIMAL(10, 2)类型的列"price"：




CREATE TABLE products (
    id INT PRIMARY KEY,
    price DECIMAL(10, 2)
);

日期和时间类型：

DATE
DATETIME
TIMESTAMP
TIME
YEAR

例如，创建一个名为"events"的表，并包含一个DATE类型的列"event\_date"：




CREATE TABLE events (
    id INT PRIMARY KEY,
    event_date DATE
);

字符串类型：

CHAR
VARCHAR
TEXT
BLOB

例如，创建一个名为"posts"的表，并包含一个VARCHAR(255)类型的列"title"和一个TEXT类型的列"content"：




CREATE TABLE posts (
    id INT PRIMARY KEY,
    title VARCHAR(255),
    content TEXT
);

枚举类型：

ENUM

例如，创建一个名为"orders"的表，并包含一个ENUM('pending', 'shipped', 'delivered')类型的列"status"：




CREATE TABLE orders (
    id INT PRIMARY KEY,
    status ENUM('pending', 'shipped', 'delivered')
);

集合类型：

例如，创建一个名为"permissions"的表，并包含一个SET('read', 'write', 'execute')类型的列"access"：




CREATE TABLE permissions (
    id INT PRIMARY KEY,
    access SET('read', 'write', 'execute')
);

以上是一些基本的数据类型使用示例，在实际应用中，你可以根据需要选择合适的数据类型，并在创建表时指定相应的数据类型。

- 阅读更多 -

MySQL —— 聚合查询，分组查询与联合查询

System

2024-08-27

所有,mysql

在MySQL中，可以使用GROUP BY子句对数据进行分组，使用AGGREGATE FUNCTIONS（如SUM(), COUNT(), MAX(), MIN(), AVG()）进行聚合查询。

分组查询实例：

假设有一个名为orders的表，包含order_id, customer_id 和 amount三个字段，以下是按customer_id分组，计算每个客户的订单总数和金额总和的查询：




SELECT customer_id, COUNT(*) AS order_count, SUM(amount) AS total_amount
FROM orders
GROUP BY customer_id;

联合查询（也称为JOIN查询）可以将多个表中的行根据相关联的列合并起来。

联合查询实例：

假设有两个表，customers（包含customer_id和customer_name）和orders（包含order_id, customer_id和amount），以下是将这两个表通过customer_id联合起来的查询：




SELECT customers.customer_name, orders.order_id, orders.amount
FROM customers
JOIN orders ON customers.customer_id = orders.customer_id;

联合分组查询：

联合分组查询是联合查询和分组查询的结合，可以根据多个表的列进行分组，并进行聚合操作。




SELECT customers.customer_name, orders.order_date, COUNT(*) AS order_count, SUM(orders.amount) AS total_amount
FROM customers
JOIN orders ON customers.customer_id = orders.customer_id
GROUP BY customers.customer_name, orders.order_date;

以上代码展示了如何联合两个表，并按客户名称和订单日期分组，计算每个客户每个订单日期的订单数和订单金额总和。

System

2024-08-27

所有,mysql

解释：

这个错误表示客户端的主机没有被授权访问MySQL服务器。这通常发生在尝试从未被明确授权的IP地址或主机名连接到MySQL服务器时。

解决方法：

登录到MySQL服务器。
使用管理员账户登录到MySQL数据库。
根据需要更新mysql.user表，给予相应用户从特定主机连接的权限。

例如，如果你想允许用户user_name从IP地址192.168.1.100连接，可以使用以下SQL命令：




GRANT ALL PRIVILEGES ON *.* TO 'user_name'@'192.168.1.100' IDENTIFIED BY 'password' WITH GRANT OPTION;
FLUSH PRIVILEGES;

这里GRANT ALL PRIVILEGES ON *.*表示授予用户对所有数据库和表的所有权限，你可以根据需要限制特定权限。'user_name'@'192.168.1.100'指定了用户名和允许连接的主机。'password'是用户的密码。FLUSH PRIVILEGES;用于立即生效。

确保替换user_name、192.168.1.100和password为实际的用户名、IP地址和密码。如果你不希望限制到特定IP，可以使用'user_name'@'%'来允许从任何主机连接。

注意：执行这些操作前，请确保你有足够的权限，并考虑到安全风险。

- 阅读更多 -

【MySQL探索之旅】数据库设计以及聚合查询

System

2024-08-27

所有,mysql




-- 创建一个简单的订单详情表
CREATE TABLE `order_details` (
  `order_id` INT NOT NULL,
  `product_id` INT NOT NULL,
  `unit_price` DECIMAL(10, 2) NOT NULL,
  `quantity` INT NOT NULL,
  PRIMARY KEY (`order_id`, `product_id`)
);
 
-- 向订单详情表中插入数据
INSERT INTO `order_details` (`order_id`, `product_id`, `unit_price`, `quantity`) VALUES
(1, 101, 10.00, 3),
(1, 102, 15.00, 2),
(2, 103, 20.00, 1),
(3, 104, 25.00, 3),
(3, 105, 30.00, 5),
(3, 106, 35.00, 2);
 
-- 查询每个订单的总金额
SELECT 
  order_id, 
  SUM(unit_price * quantity) AS total_amount
FROM 
  order_details
GROUP BY 
  order_id;

这段代码首先创建了一个名为order_details的表，并定义了order_id和product_id作为主键，然后插入了一些示例数据。最后，使用GROUP BY子句和SUM函数进行了一个聚合查询，计算了每个订单的总金额。这个过程展示了如何设计数据库表、向表中插入数据以及如何执行聚合查询，这是数据库开发的基本技能。

- 阅读更多 -

【数仓】DataX软件安装及配置，从mysql同步到hdfs

System

2024-08-27

所有,mysql

DataX 是一款由阿里巴巴开源的大数据同步工具，主要用于在各种异构数据源间高效地完成数据的同步工作。以下是如何安装和配置 DataX，以及如何使用 DataX 从 MySQL 同步数据到 HDFS 的简要步骤。

安装 DataX
- 下载地址：https://github.com/alibaba/DataX
- 解压到指定目录
配置 DataX
- 在 datax/job/ 目录下创建一个新的配置文件，例如 mysql2hdfs.json
编辑 mysql2hdfs.json 配置文件




{
    "job": {
        "setting": {
            "speed": {
                "channel": 1
            }
        },
        "content": [
            {
                "reader": {
                    "name": "mysqlreader",
                    "parameter": {
                        "username": "your_mysql_username",
                        "password": "your_mysql_password",
                        "column": ["id", "name", "age"],
                        "splitPk": "id",
                        "connection": [
                            {
                                "table": ["your_table_name"],
                                "jdbcUrl": ["jdbc:mysql://your_mysql_host:3306/your_database"]
                            }
                        ]
                    }
                },
                "writer": {
                    "name": "hdfswriter",
                    "parameter": {
                        "defaultFS": "hdfs://your_hdfs_host:8020",
                        "fileType": "text",
                        "path": "/user/hive/warehouse/your_hdfs_target_table_path",
                        "fileName": "your_output_file_name",
                        "column": [
                            {
                                "name": "id",
                                "type": "int"
                            },
                            {
                                "name": "name",
                                "type": "string"
                            },
                            {
                                "name": "age",
                                "type": "int"
                            }
                        ],
                        "writeMode": "append",
                        "fieldDelimiter": ","
                    }
                }
            }
        ]
    }
}

运行 DataX
- 在 DataX 的根目录下，使用以下命令运行：




python datax/bin/datax.py job/mysql2hdfs.json

确保在运行之前已经安装了 Python 环境，并且 MySQL 和 HDFS 服务是可用的。以上步骤和配置文件仅作为示例，实际使用时需要根据实际情况调整配置，例如数据库的用户名、密码、表名、HDFS 的地址和端口等。

- 阅读更多 -

MySQL表的增删改查（CRUD）

System

2024-08-27

所有,mysql

以下是MySQL表的基本增删改查操作的示例代码：




-- 创建表
CREATE TABLE IF NOT EXISTS users (
    id INT AUTO_INCREMENT PRIMARY KEY,
    username VARCHAR(50) NOT NULL,
    email VARCHAR(100) NOT NULL
);
 
-- 插入数据
INSERT INTO users (username, email) VALUES ('user1', 'user1@example.com');
 
-- 查询数据
SELECT * FROM users;
 
-- 更新数据
UPDATE users SET username='user2' WHERE id=1;
 
-- 删除数据
DELETE FROM users WHERE id=1;

这段代码展示了如何创建一个简单的用户表，如何向表中插入一条新记录，如何查询表中的所有记录，如何更新记录，以及如何删除记录。这些操作是任何数据库驱动的应用程序的基础。

- 阅读更多 -

k8s学习--利用helm部署应用mysql，加深helm的理解

System

2024-08-27

所有,mysql




# 安装Helm客户端
curl https://raw.githubusercontent.com/helm/helm/master/scripts/get-helm-3 | bash
 
# 添加官方Helm仓库
helm repo add bitnami https://charts.bitnami.com/bitnami
 
# 更新Helm仓库信息
helm repo update
 
# 安装MySQL
helm install my-mysql bitnami/mysql --version 6.10.0
 
# 查看安装的版本
helm list
 
# 查看安装的详细信息
helm status my-mysql
 
# 通过values.yaml文件自定义配置
helm install my-mysql bitnami/mysql -f values.yaml
 
# 卸载MySQL
helm uninstall my-mysql

在这个例子中，我们首先下载并安装Helm客户端。然后，我们添加了Helm的官方仓库，并更新了本地的仓库信息。接下来，我们使用Helm安装了MySQL，并指定了版本号。我们还展示了如何查看已安装的版本和详细信息，以及如何通过values.yaml文件自定义配置。最后，我们展示了如何卸载已安装的MySQL。这个过程加深了对Helm的理解，并能够在实际应用中使用Helm来管理Kubernetes应用的部署。

- 阅读更多 -

Mysql 的账户管理，索引，存储引擎

System

2024-08-27

所有,mysql

在MySQL中，账户管理涉及创建用户、分配权限和管理用户的密码。以下是一些基本的SQL命令来管理MySQL账户：




-- 创建新用户
CREATE USER 'username'@'hostname' IDENTIFIED BY 'password';
 
-- 授权用户
GRANT ALL PRIVILEGES ON database_name.* TO 'username'@'hostname';
 
-- 设置或更改用户密码
SET PASSWORD FOR 'username'@'hostname' = PASSWORD('new_password');
 
-- 刷新权限
FLUSH PRIVILEGES;

索引是一种数据结构，可以帮助数据库高效地查找、排序和访问数据表中的特定列。以下是创建索引的基本SQL命令：




-- 创建普通索引
CREATE INDEX index_name ON table_name(column_name);
 
-- 创建唯一索引
CREATE UNIQUE INDEX index_name ON table_name(column_name);
 
-- 创建全文索引
CREATE FULLTEXT INDEX index_name ON table_name(column_name);

MySQL支持多种存储引擎，每种引擎都有其特定的用途和特性。以下是查看和更改当前默认存储引擎的命令：




-- 查看当前默认存储引擎
SHOW VARIABLES LIKE 'storage_engine%';
 
-- 更改默认存储引擎
SET DEFAULT_STORAGE_ENGINE=engine_name;

请注意，具体的SQL语法可能会根据MySQL的版本而有所不同。在应用上述命令时，请确保替换掉 'username'、'hostname'、'database\_name'、'table\_name' 和 'column\_name' 以及 'new\_password' 为实际的值。同时，执行权限操作时应谨慎，避免引起安全问题。

- 阅读更多 -

MySQL Binlog解析回调中间件：实战实现与深度解析

一、Binlog 基础与核心概念

1.1 什么是 Binlog

1.2 行模式(Row-Based)与语句模式(Statement-Based)

1.3 Binlog 解析方式

二、整体架构与中间件定位

2.1 需求与场景

三、核心组件实现与代码示例

3.1 依赖与基础配置

3.2 BinlogConnector：负责连接与事件拉取

3.3 EventDispatcher：解析 RowEvent 并分发

3.3.1 重要点说明

3.4 OffsetStorage：持久化位点（可选多种实现）

3.5 业务使用示例

四、数据流及回调流程图解

五、深度解析与进阶优化

5.1 数据可靠性与事务完整性

5.2 高吞吐与性能优化

5.3 多实例与水平扩展

5.4 元数据同步与 Schema 变更处理

六、完整示例回顾与测试

6.1 完整代码结构

6.2 集成测试思路

七、小结

分布式系统中的一致性保障：深入探索MySQL XA协议

一、引言

二、XA 协议概览

三、XA 协议流程详解

3.1 三个参与者示意图说明

3.2 阶段一：XA START / XA OPEN

3.3 阶段二：XA END + XA PREPARE

3.4 阶段三：XA COMMIT / XA ROLLBACK

四、XA 关键命令与用法示例

4.1 环境假设

4.2 脚本示例：跨库转账 100 元

五、XA 协议中的故障场景与恢复

5.1 TM 崩溃或网络故障

5.2 某个 RM 宕机

5.3 应用 XA RECOVER 命令

六、XA 协议示意图解

七、XA 协议实现细节与优化

7.1 XID 结构和唯一性

7.2 事务日志与持久化

7.3 并发事务与并行提交

7.4 分布式事务性能考量

八、实践建议与总结

5.3 应用 `XA RECOVER` 命令