ibd2sql 是使用python3 编写的 提取mysql 5.7/8.0 innodb存储引擎在磁盘上的 ibd 文件信息为SQL语句的工具.
不需要连接数据库, 只需要对目录ibd文件有可读权限即可. 无第三方依赖包, 纯python3代码. 使用GPL-3.0 license.
博客介绍
视频介绍
- 方便: 提取表DDL
- 实用: 可替换库(--schema)/表(--table)名, 可在sql语句中输出完整的字段(--complete)
- 简单: 纯python3代码编写, 无依赖包. 还可以使用**--debug**查看解析过程
- 选择性强: 可以根据条件过滤符合要求的数据 --where , --limit
- 支持众多数据类型: 支持所有mysql数据类型 (比如 int, decimal, date, varchar, char, json, binary, enum, set, blob/text, longblob,空间坐标等).
- 支持复杂的表结构: 分区表, 注释, 主键, 外键, 约束, 自增, 普通索引, 前缀索引, 主键前缀索引, 唯一索引, 复合索引, 默认值, 符号, 虚拟字段, INSTANT, 无主键等情况的表
- 数据误删恢复: 可以输出被标记为deleted的数据
- 安全: 离线解析ibd文件, 仅可读权限即可
- 支持范围广: 支持mysql 5.7 or 8.x
最新版: https://github.com/ddcw/ibd2sql/archive/refs/heads/main.zip
次新版: https://github.com/ddcw/ibd2sql/archive/refs/tags/v1.3.tar.gz
可使用 python3 main.py -h
查看帮助信息
SHELL>python3 main.py -h
usage: main.py [--help] [--version] [--ddl] [--sql] [--delete] [--complete-insert] [--force] [--set] [--multi-value]
[--replace] [--table TABLE_NAME] [--schema SCHEMA_NAME] [--sdi-table SDI_TABLE] [--where-trx WHERE_TRX]
[--where-rollptr WHERE_ROLLPTR] [--limit LIMIT] [--debug] [--debug-file DEBUG_FILE] [--page-min PAGE_MIN]
[--page-max PAGE_MAX] [--page-start PAGE_START] [--page-count PAGE_COUNT] [--page-skip PAGE_SKIP]
[FILENAME]
解析mysql 5.7/8.0的ibd文件 https://github.com/ddcw/ibd2sql
positional arguments:
FILENAME ibd filename
options:
--help, -h show help
--version, -v, -V show version
--ddl, -d print ddl
--sql print data by sql
--delete print data only for flag of deleted
--complete-insert use complete insert statements for sql
--force, -f force pasrser file when Error Page
--set set/enum to fill in actual data instead of strings
--multi-value single sql if data belong to one page
--replace "REPLACE INTO" replace to "INSERT INTO" (default)
--table TABLE_NAME replace table name except ddl
--schema SCHEMA_NAME replace table name except ddl
--sdi-table SDI_TABLE
read SDI PAGE from this file(ibd)(partition table)
--where-trx WHERE_TRX
default (0,281474976710656)
--where-rollptr WHERE_ROLLPTR
default (0,72057594037927936)
--limit LIMIT limit rows
--debug, -D will DEBUG (it's too big)
--debug-file DEBUG_FILE
default sys.stdout if DEBUG
--page-min PAGE_MIN if PAGE NO less than it, will break
--page-max PAGE_MAX if PAGE NO great than it, will break
--page-start PAGE_START
INDEX PAGE START NO
--page-count PAGE_COUNT
page count NO
--page-skip PAGE_SKIP
skip some pages when start parse index page
Example:
ibd2sql /data/db1/xxx.ibd --ddl --sql
ibd2sql /data/db1/xxx.ibd --delete --sql
ibd2sql /data/db1/xxx#p#p1.ibd --sdi-table /data/db1/xxx#p#p0.ibd --delete --sql
--ddl
python3 main.py /data/mysql_3314/mysqldata/ibd2sql/ddcw_alltype_table.ibd --ddl
--sql
python3 main.py /data/mysql_3314/mysqldata/ibd2sql/ddcw_alltype_table.ibd --sql
binary数据会被转为 base64
set/enum会被替换为实际值(v0.3版本是使用数字表示)
--sql --delete
SHELL> python3 main.py /data/mysql_3314/mysqldata/ibd2sql/ddcw_alltype_table.ibd --sql --delete
--sdi-table xxx#p0.ibd
SHELL> python3 main.py /data/mysql_3314/mysqldata/ibd2sql/ddcw_partition_hash#p#p3.ibd --sdi-table /data/mysql_3314/mysqldata/ibd2sql/ddcw_partition_hash#p#p0.ibd --sql
--complete
SHELL> python3 main.py /data/mysql_3314/mysqldata/ibd2sql/ddcw_alltype_table.ibd --sql --complete
--mysql5
用来标识这是一个mysql5的ibd文件. 不然就不做解析.
由于5.7的ibd文件没得sdi_page, 得解析frm文件获取元数据信息, 虽然也解析过frm结构, 但我懒得去写了. 就直接沿用8.0的sdi吧. 故 解析 5.7的ibd文件 需要先使用 mysqlfrm
提取出DDL, 并插入到8.0的环境里面, 然后再使用本工具来解析5.7的ibd文件
# 提取出DDL
mysqlfrm /data/mysql_3308/mysqldata/db1/ddcw_alltype_table.frm --diagnostic
# 然后导入到8.0环境(以获取SDI信息.)
....
# 就可以使用本工具解析了
python3 main.py --sdi-table /data/mysql_3314/mysqldata/ibd2sql/ddcw_alltype_table.ibd /data/mysql_3308/mysqldata/db1/ddcw_alltype_table.ibd --sql --mysql5
版本 | 变更时间 | 说明 | 备注 |
---|---|---|---|
v0.1 | 2023.4.27 | 第一个版本.... | |
v0.2 | 2023.08.30 | 支持更多数据类型 | 1. 修复year/tinyint的支持 2. 符号支持(对于数字类型) 3. 更多的数据类型支持 4. 更多的表属性支持 5. 美化输出 6. 支持表名替换 7. 支持--complete-insert |
v0.3 | 2023.10.13 | 支持5.7升级到8.0的ibd文件 | 修复一些BUG |
v1.0 | 2024.01.05 | 支持debug 支持更多类型和功能 |
1. 支持DEBUG 2. 支持分区表 3. 支持唯一索引 4.支持虚拟列 5. 支持instant 6.支持约束和外键 7. 支持限制输出 8.支持前缀索引 |
v1.1 | 2024.04.12 | 修复一些bug | 1. 8.0.13 默认值时间戳 2. 8.0.12 无hidden 3. online ddl instant |
v1.2 | 2024.04.25 | 新增空间坐标的支持 | 支持geometry[collection],[multi]point,[multi]linestring,[multi]polygon |
v1.3 | 2024.05.11 | 支持mysql 5.7 | 本来准备做二级分区支持的, 但看了下, WC, 太复杂了-_- 那就更新个支持5.7的吧(其实结构和8.0是差不多的) (for issue 7) |
- 前缀索引支持. 前缀索引完整数据在数据字段而不是KEY
- json/blob等大对象支持: 支持大对象
- 5.7升级到8.0后找不到SDI. :sdi pagno 记录在第一页
- bigint类型,注释,表属性 : 支持更多数据类型, 和表属性
- 只有1个主键和其它 : 支持只有1个主键的情况, 并新增DEBUG功能
- 默认值为时间戳 : 支持默认值为时间戳, blob等字段的前缀索引
- 8.0.12 无hidden : 取消hidden检查
- ONLINE DDL instant : record 1-2 bit is instant flag
- mysql 5.7 解析无数据 : mysql 5.7无SDI PAGE, INODE不需要去掉第一个INDEX
- char字段为ascii : char字段如果是ascii字符集则不会额外记录字段长度
环境要求: python3
-
学习python3
只是单纯的学习python3代码编写. 本工具使用的纯python3编写的, 无第三方依赖包, 适合学习python3
-
学习mysql
学习mysql的底层原理, innodb 各种数据类型在磁盘上的格式. 比如知道page_id为4字节, 就能计算出单个ibd文件的最大为 PAGE_SIZE*PAGE_ID_MAX = 16KB*(2^32)=64TB
直接阅读源码的话, 难度太大. 就可以使用本工具 --debug
功能查看ibd解析过程. 还可以搭配--page-min --page-max --page-start --page-count --page-skip
一起使用
-
数据恢复
比如不小心删除了某个ibd文件, 但好歹从磁盘上恢复出来了, 但不知道表结构, 就可以使用 --ddl 查看表结构了.
或者不小心 delete了某些数据, 但又没开启binlog, 就可以使用
--delete
查看误删的数据了.
-
其它
想看下第一行数据是啥, 登录数据库太麻烦了, 就可以 --sql --limit 1
想看下在某个事务之后跟新的数据信息, 可以使用 --where-trx=(start_trx, end_trx) 查看在这个限制内更新的数据信息了.
想导出数据到其它环境, 比如 python main.py --limit 10 xxx.ibd --schema xxxx | mysql
查看表结构 python main.py --ddl