知识点整理（五）——mysql分页问题

逐暗者2021-09-092021-09-09

前言

mysql在大数据量的情况下使用limit分页，会随着页码增大而查询效率低下。该怎么优化呢？

先看是不是，再看为什么，最后看怎么办

准备

mysql

本次操作使用mysql8

表

为了验证大数据量，我们先准备一张5000万条记录的表。

CREATE TABLE `demo_5000` (
  `id` bigint NOT NULL AUTO_INCREMENT,
  `a` int NOT NULL,
  `b` int NOT NULL,
  `c` int NOT NULL,
  `d` varchar(45) NOT NULL,
  `f` varchar(45) NOT NULL,
  `g` varchar(45) NOT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_combo` (`a`,`b`,`c`)
) ENGINE=InnoDB AUTO_INCREMENT=50010007 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;

一张简单的表，主键自增，3个int字段和3个varchar字段，并建立一个联合索引。

sql语句

1	set profiling = 1;

临时开启性能分析。

1	show profile CPU,SWAPS,BLOCK IO,MEMORY,SOURCE for query [querID]

查看性能。

explain （查看执行计划）和 SQL_NO_CACHE （跳过缓存）

limit offset,size 分页

根据a字段降序，进行分页查询

查询1万左右的

1	select SQL_NO_CACHE * from demo_5000 order by id desc limit 10000,100;

使用 show profile 查看性能。

查询10万左右的

1	select SQL_NO_CACHE * from demo_5000 order by id desc limit 100000,100;

查询100万左右的

1	select SQL_NO_CACHE * from demo_5000 order by id desc limit 1000000,100;

到这里我们其实就可以看出结果了，随着页码变大，效率会急剧下降。虽然每一次查询只取100条数据，但查询前1万和前10万左右的记录时间是差不多的，但到100万时性能就相差非常大。（当然这和表结构有关）

为什么？

那为什么会这样呢？我们可以使用执行计划来看一下。

1
2
3

explain select * from demo_5000  order by a desc  limit 10000,100;
explain select * from demo_5000  order by a desc  limit 100000,100;
explain select * from demo_5000  order by a desc  limit 1000000,100;