MySQL--binlog2sql 安装及使用

时间:2023-02-10 16:58:03

安装:

依赖python3,请提前安装

开源地址:https://github.com/danfengcao/binlog2sql

$ curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py   # 下载安装脚本

$ sudo python get-pip.py    # 运行安装脚本

shell> git clone https://github.com/danfengcao/binlog2sql.git && cd binlog2sql

shell> pip install -r requirements.txt


使用:

MySQL server必须设置以下参数:

[mysqld]

server_id = 1

log_bin = /var/log/mysql/mysql-bin.log

max_binlog_size = 1G

binlog_format = row

binlog_row_image = full

user需要的最小权限集合:

select, super/replication client, replication slave


建议授权

GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO  admin@'%' identified by 'admin';

权限说明


select:需要读取server端information_schema.COLUMNS表,获取表结构的元信息,拼接成可视化的sql语句

super/replication client:两个权限都可以,需要执行'SHOW MASTER STATUS', 获取server端的binlog列表

replication slave:通过BINLOG_DUMP协议获取binlog内容的权限


选项

mysql连接配置

-h host; -P port; -u user; -p password

解析模式

--stop-never 持续解析binlog。可选。默认False,同步至执行命令时最新的binlog位置。

-K, --no-primary-key 对INSERT语句去除主键。可选。默认False

-B, --flashback 生成回滚SQL,可解析大文件,不受内存限制。可选。默认False。与stop-never或no-primary-key不能同时添加。

--back-interval -B模式下,每打印一千行回滚SQL,加一句SLEEP多少秒,如不想加SLEEP,请设为0。可选。默认1.0。


解析范围控制

--start-file 起始解析文件,只需文件名,无需全路径 。必须。

--start-position/--start-pos 起始解析位置。可选。默认为start-file的起始位置。

--stop-file/--end-file 终止解析文件。可选。默认为start-file同一个文件。若解析模式为stop-never,此选项失效。

--stop-position/--end-pos 终止解析位置。可选。默认为stop-file的最末位置;若解析模式为stop-never,此选项失效。

--start-datetime 起始解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。

--stop-datetime 终止解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。


对象过滤

-d, --databases 只解析目标db的sql,多个库用空格隔开,如-d db1 db2。可选。默认为空。

-t, --tables 只解析目标table的sql,多张表用空格隔开,如-t tbl1 tbl2。可选。默认为空。

--only-dml 只解析dml,忽略ddl。可选。默认False。

--sql-type 只解析指定类型,支持INSERT, UPDATE, DELETE。多个类型用空格隔开,如--sql-type INSERT DELETE。可选。默认为增删改都解析。用了此参数但没填任何类型,则三者都不解析。


解析标准sql输出:(根据各自条件判断 )

python binlog2sql.py  -h127.0.0.1  -P3306 -uadmin -p'admin' -d test -t tt21 --start-file='mysql-bin.000006'  


(binlog2sql对于同一个事务会输出同样的start position)

进一步缩减范围

通过mysqlbinlog 解析binlog 日志,确定误操作的位置

再根据位置进一步过滤,使用flashback模式生成回滚sql,检查回滚sql是否正确(注:真实环境下,此步经常会进一步筛选出需要的sql。结合grep、编辑器等)

解析回滚sql:

python binlog2sql.py -h127.0.0.1   -P3306 -uadmin -p'admin' -dtest -tt21 --start-file='mysql-bin.000006' --start-position=3346 --stop-position=3556 -B > rollback_tt21.sql


TIPS

闪回的目标:快速筛选出真正需要回滚的数据。

先根据库、表、时间做一次过滤,再根据位置做更准确的过滤。

由于数据一直在写入,要确保回滚sql中不包含其他数据。可根据是否是同一事务、误操作行数、字段值的特征等等来帮助判断。

执行回滚sql时如有报错,需要查实具体原因,一般是因为对应的数据已发生变化。由于是严格的行模式,只要有唯一键(包括主键)存在,就只会报某条数据不存在的错,不必担心会更新不该操作的数据。业务如果有特殊逻辑,数据回滚可能会带来影响。

如果只回滚某张表,并且该表有关联表,关联表并不会被回滚,需与业务方沟通清楚


限制(对比mysqlbinlog)

mysql server必须开启,离线模式下不能解析

参数 binlog_row_image 必须为FULL,暂不支持MINIMAL

解析速度不如mysqlbinlog


优点(对比mysqlbinlog)

纯Python开发,安装与使用都很简单

自带flashback、no-primary-key解析模式,无需再装补丁

flashback模式下,更适合闪回实战

解析为标准SQL,方便理解、筛选

代码容易改造,可以支持更多个性化解析


案例

test库tt8 表原有数据

mysql> select * from tt8;

mysql> select * from tt8;

+----+--------+----------------------------+-----------------------+----------+

| id | id_tye | zt_name                    | zdr_name              | zdr_id   |

+----+--------+----------------------------+-----------------------+----------+

|  1 | "IN"   | "北京                      | KK科技有限公司"       | "郭三"   |

|  2 | "IN"   | "北京                      | KK科技有限公司"       | "郭四"   |

| 28 | OUT    | 辽宁KK服务有限公司         | 尚XX                  | 21361    |

| 29 | OUT    | 辽宁KK服务有限公司         | 尚XX                  | 21361    |

| 30 | OUT    | 辽宁KK服务有限公司         | SYSADMIN              | sysadmin |

| 31 | OUT    | 辽宁KK服务有限公司         | SYSADMIN              | sysadmin |

+----+--------+----------------------------+-----------------------+----------+


执行行删除操作

mysql> delete from tt8 where id=30;

Query OK, 1 row affected (0.02 sec)


数据恢复步骤:

1、登录mysql,查看目前binlog文件


mysql> show master logs;

+------------------+-----------+-----------+

| Log_name         | File_size | Encrypted |

+------------------+-----------+-----------+

| mysql-bin.000001 |      1928 | No        |

| mysql-bin.000002 |     17004 | No        |

| mysql-bin.000003 |      7403 | No        |

| mysql-bin.000004 |      1093 | No        |

+------------------+-----------+-----------+

4 rows in set (0.00 sec)


2、获取最新的binlog文件是mysql-bin.000004,获取操作人提供大致操作时间,我们根据大致时间过滤数据

python3 binlog2sql.py   -h172.20.2.181 -P3308 -uadmin -padmin -dtest -ttt8 --start-file='mysql-bin.000003' --stop-file='mysql-bin.000004' --start-datetime='2023-02-10 15:01:00' --stop-datetime='2023-02-10 16:30:00'


USE b'mysql';

CREATE USER 'admin'@'%' IDENTIFIED WITH 'mysql_native_password' AS '*4ACFE3202A5FF5CF467898FC58AAB1D615029441';

USE b'mysql';

GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'admin'@'%';

DELETE FROM `test`.`tt8` WHERE `id`=30 AND `id_tye`='OUT' AND `zdr_id`='辽宁KK服务有限公司' AND `zdr_name`='SYSADMIN' AND `zt_name`='sysadmin' LIMIT 1; #start 702 end 1062 time 2023-02-10 16:18:44


3、我们得到了误操作sql的准确位置在702-1062之间,再根据位置进一步过滤,使用flashback模式生成回滚sql,检查回滚sql是否正确(注:真实环境下,此步经常会进一步筛选出需要的sql。结合grep、编辑器等)

python3 binlog2sql.py   -h172.20.2.181 -P3308 -uadmin -padmin -dtest -ttt8 --start-file='mysql-bin.000003' --stop-file='mysql-bin.000004' --start-datetime='2023-02-10 15:01:00' --stop-datetime='2023-02-10 16:30:00' -B > test_tt8_recover.sql

more test_tt8_recover.sql  

INSERT INTO `test`.`tt8`(`id`, `id_tye`, `zdr_id`, `zdr_name`, `zt_name`) VALUES (30, 'OUT', '辽宁KK服务有限公司', 'SYSADMIN', 'sysadmin'); #s

tart 702 end 1062 time 2023-02-10 16:18:44


4、确认回滚sql正确,执行回滚语句。登录mysql确认,数据回滚成功。

mysql -h172.20.2.181 -P3308 -uadmin -padmin < test_tt8_recover.sql  

mysql>  select * from tt8;

+----+--------+----------------------------+-----------------------+----------------------------+

| id | id_tye | zt_name                    | zdr_name              | zdr_id                     |

+----+--------+----------------------------+-----------------------+----------------------------+

|  1 | "IN"   | "北京                      | KK科技有限公司"       | "郭三"                     |

|  2 | "IN"   | "北京                      | KK科技有限公司"       | "郭四"                     |

| 28 | OUT    | 辽宁KK服务有限公司         | 尚XX                  | 21361                      |

| 29 | OUT    | 辽宁KK服务有限公司         | 尚XX                  | 21361                      |

| 30 | OUT    | sysadmin                   | SYSADMIN              | 辽宁KK服务有限公司         |

| 31 | OUT    | 辽宁KK服务有限公司         | SYSADMIN              | sysadmin                   |

+----+--------+----------------------------+-----------------------+----------------------------+