为了获取每个重复数据中最新的一条记录,我们可以使用MySQL的窗口函数ROW_NUMBER()
,结合ORDER BY
语句来实现。以下是一个示例SQL查询,它使用了这种方法来筛选出每个重复项中id
最大(即最新)的记录。
WITH RankedItems AS (
SELECT
*,
ROW_NUMBER() OVER(PARTITION BY duplicate_column ORDER BY id DESC) AS rn
FROM
your_table
WHERE
duplicate_condition
)
SELECT *
FROM RankedItems
WHERE rn = 1;
在这个查询中:
your_table
是你的数据表名。duplicate_column
是你用来识别重复数据的列。duplicate_condition
是你的其他筛选条件。id
是用来确定记录新旧的列,通常是一个自增的主键。
这个查询的工作原理是:
- 使用
ROW_NUMBER()
窗口函数,为每个重复组内的记录分配一个唯一的序号。 PARTITION BY duplicate_column
表示按照duplicate_column
进行分组。ORDER BY id DESC
表示在每组内按照id
列降序排列。- 最外层的
WHERE rn = 1
确保只选出每组中id
最大(即最新)的记录。