Postgresql内核源码分析-redo是如何恢复丢失数据的

这篇文章距离上次修改已过502天，其中的内容可能已经有所变动。

在PostgreSQL中，数据的恢复是通过重做（redo）日志来实现的。当数据页面（通常为8KB大小）被修改时，修改的数据会被先记录到日志中，然后在日志被确认安全后，这些修改才会应用到数据页面中。如果数据页面因为某些原因（如硬件故障）损坏，PostgreSQL可以通过重做日志来恢复数据。

重做（redo）日志的工作原理如下：

当数据库修改数据页面时，它首先将这些改动写入日志缓冲区。
在事务提交时，日志缓冲区的内容被刷新到磁盘上的日志文件中，这个过程称为日志记录（logging）。
当事务提交后，日志缓冲区的内容会被释放，但是对应的日志记录会被保留在磁盘上，用于恢复。
系统定期检查已经记录的日志记录是否已经安全地写入磁盘，如果是，那么这些日志记录就可以被删除了。
如果数据页面因为某种原因丢失，比如磁盘故障，PostgreSQL可以通过重做日志来恢复数据。它会从最近的检查点开始，重播所有未提交的事务的日志记录，并应用这些改动到数据页面上。

这个过程保证了即使数据页面损坏，数据库也能恢复到最后一次已知良好状态的一致性备份。

以下是一个简化的代码示例，描述了重做日志记录和恢复的概念：




// 假设这是日志记录的结构体
typedef struct XLogRecord {
    uint64     lsn;        /* 逻辑序列号 */
    uint32     size;       /* 日志记录的大小 */
    char       data[FLEXIBLE_ARRAY_MEMBER]; /* 实际的数据变更 */
} XLogRecord;
 
// 假设这是数据页面的结构体
typedef struct Page {
    ...
    char       data[SIZE_OF_DATA]; /* 页面数据 */
    ...
} Page;
 
// 假设这是事务开始的函数
void StartTransaction() {
    // 开始记录事务
    ...
}
 
// 假设这是事务结束的函数
void CommitTransaction() {
    // 将日志记录写入磁盘，并释放日志缓冲区资源
    WriteAndFreeLog();
    ...
}
 
// 假设这是恢复数据的函数
void RecoverData() {
    // 从最近的检查点开始，重播所有未提交的事务的日志记录
    ReplayWAL();
    ...
}
 
// 假设这是数据修改的函数
void ModifyData() {
    StartTransaction(); // 开始事务
    // 修改数据页面
    ...
    CommitTransaction(); // 提交事务
}
 
// 假设这是数据页面损坏的情况
void PageCorruption() {
    // 通过重做日志恢复数据
    RecoverData();
    ...
}

在这个示例中，StartTransaction、CommitTransaction和ModifyData代表了数据修改的一般流程。RecoverData是在数据页面损坏时，用于恢复数据的函数。这个过程保证了即使数据页面损坏，也可以通过重做日志来恢复数据。

Postgresql内核源码分析-redo是如何恢复丢失数据的

评论已关闭

推荐阅读