「推荐收藏!」【MySQL技术之旅】(5)「主从架构」一直都倾向于优化查询,这次学习一下优化Insert插入语句

时间:2023-02-19 13:04:30

「推荐收藏!」【MySQL技术之旅】(5)「主从架构」一直都倾向于优化查询,这次学习一下优化Insert插入语句

分析一下插入数据的因素

插入一个记录需要的时间由下列因素组成,大概分析相关的因素百分比是?

  • 连接耗时:百分之30的因素
  • 发送查询给服务器耗时:百分之20的因素
  • 分析查询耗时:百分之20的因素
  • 插入记录耗时:百分之10的因素
  • 插入索引耗时:百分之10的因素
  • 关闭连接耗时:百分之10的因素

如果不考虑打开表的初始开销,每个并发运行的查询打开表的大小以logN (B树)的速度减慢索引的插入。

如何加快插入数据的方案

合并插入SQL的语句操作

如果同时从同一个客户端插入很多行,使用含多个VALUE的INSERT语句同时插入几行。这比使用单行INSERT语句快(在某些情况下快几倍)。

调节批次插入的缓冲池大小

如果你正向一个非空表添加数据,可以调节bulk_insert_buffer_size变量,使数据插入更快。

采用Insert Delayed语句进行插入操作控制

如果你从不同的客户端插入很多行(无法合并SQL语句的操作处理),能通过INSERT DELAYED语句加快速度。

INSERT DELAYED 语法
INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE]
[INTO] tbl_name [(col_name,...)]
VALUES ({expr | DEFAULT},...),(...),...
[ ON DUPLICATE KEY UPDATE col_name=expr, ... ]

或:

INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE]
[INTO] tbl_name
SET col_name={expr | DEFAULT}, ...
[ ON DUPLICATE KEY UPDATE col_name=expr, ... ]

用于INSERT语句的DELAYED选项是MySQL相对于标准SQL的扩展,如果您的客户端不能等待INSERT完成,则这个选项是非常有用的。

  • 当您使用MySQL进行日志编写时,这是非常常见的问题。您也可以定期运行SELECT和UPDATE语句,这些语句花费的时间较长。
  • 当客户端使用INSERT DELAYED时,会立刻从服务器处得到一个确定。并且行被排入队列,当表没有被其它线程使用时,此行被插入。
  • 使用INSERT DELAYED的另一个重要的好处是,来自许多客户端的插入被集中在一起,并被编写入一个块。这比执行许多独立的插入要快很多。
使用DELAYED时有一些限制
  • INSERT DELAYED仅适用于MyISAM, MEMORY和ARCHIVE表。对于MyISAM表,如果在数据文件的中间没有空闲的块,则支持同时采用SELECT和INSERT语句。
  • 在这些情况下,基本不需要对MyISAM使用INSERT DELAYED。
  • INSERT DELAYED应该仅用于指定值清单的INSERT语句。
  • 服务器忽略用于INSERT DELAYED...SELECT语句的DELAYED。
  • 服务器忽略用于INSERT DELAYED...ON DUPLICATE UPDATE语句的DELAYED。

As of MySQL 5.6.6, INSERT DELAYED is deprecated; expect it to be removed in a future release. Use INSERT (without DELAYED) instead.

  • 因为在行被插入前,语句立刻返回,所以您不能使用LAST_INSERT_ID()来获取AUTO_INCREMENT值。AUTO_INCREMENT值可能由语句生成。
  • 对于SELECT语句,DELAYED行不可见,直到这些行确实被插入了为止。DELAYED在从属复制服务器中被忽略了,因为DELAYED不会在从属服务器中产生与主服务器不一样的数据。

注意,目前在队列中的各行只保存在存储器中,直到它们被插入到表中为止。这意味着,如果您强行中止了mysqld(例如,使用kill -9)或者如果mysqld意外停止,则所有没有被写入磁盘的行都会丢失。

以下详细描述了当您对INSERT或REPLACE使用DELAYED选项时会发生什么情况, 在这些描述中,“线程”指的是已接受了一个INSERT DELAYED语句的线程,“管理程序”指的是为某个特定的表处理所有INSERT DELAYED语句的线程。

当线程对一个表执行DELAYED语句时,会创建出一个管理程序线程,对用于本表的所有DELAYED语句进行处理。

  • 线程会检查是否管理程序以前已获取了DELAYED锁定;如果没有获取,则告知管理程序线程进行此项操作。即使其它线程对表有READ或WRITE锁定,也可以获得DELAYED锁定。但是管理程序会等待所有的ALTER TABLE锁定或FLUSH TABLE锁定,以确保表的结构是最新的。
  • 线程执行INSERT语句,但不是把行写入表中,而是把最终行的拷贝放入一个由管理程序线程管理的队列中。线程会提示出现语法错误,这些错误会被报告到客户端中。
采用MyISAM引擎,可以提高并发度

如果用MyISAM,如果在表中没有删除的行,能在SELECT语句正在运行的同时插入行。

直接通过文本载入

当从一个文本文件装载一个表时,使用LOAD DATA INFILE。这通常比使用很多INSERT语句快20倍。当表有很多索引时,有可能要多做些工作使得LOAD DATA INFILE更快些。

锁定表加速insert操作
  • 锁定表可以加速用多个语句执行的INSERT操作
  • 这样性能会提高,因为索引缓存区仅在所有INSERT语句完成后刷新到磁盘上一次。一般有多少INSERT语句即有多少索引缓存区刷新。如果能用一个语句插入所有的行,就不需要锁定。对于事务表,应使用BEGIN和COMMIT代替LOCK TABLES来加快插入。
  • INSERT、UPDATE和DELETE操作在MySQL中是很快的,通过为在一行中多于大约5次连续不断地插入或更新的操作加锁,可以获得更好的整体性能。如果在一行中进行多次插入,可以执行LOCK TABLES,随后立即执行UNLOCK TABLES(大约每1000行)以允许其它的线程访问表。这也会获得好的性能。
锁表
LOCK TABLES `order` WRITE;
禁用键
ALTER TABLE `order` DISABLE KEYS ;
插入数据
INSERT INTO `order` VALUES (1,11,'UPDATED');
INSERT INTO `order` VALUES (2,11,'UPDATED');
启用键
ALTER TABLE `order` ENABLE KEYS;
解锁表
UNLOCK TABLES;
key_buffer_size提高扩充键缓冲区

为了对LOAD DATA INFILE和INSERT在MyISAM表得到更快的速度,通过增加key_buffer_size系统变量来扩大 键高速缓冲区

参考分析