基于inception的自动化SQL操作平台,支持工单、审核、定时任务、邮件、OSC等功能,额外可配置功能有MySQL查询、动态脱敏、查询权限管理、慢查询管理、阿里云RDS管理等
python:3.4及以上
django:1.8.17
mysql : 5.6及以上
linux : 64位linux操作系统均可
- 自动审核
发起SQL上线,工单提交,由inception自动审核,审核通过后需要由审核人进行人工审核 - 人工审核
inception自动审核通过的工单,由其他研发工程师或研发经理来审核,DBA操作执行SQL
为什么要有人工审核?
这是遵循运维领域线上操作的流程意识,一个工程师要进行线上数据库SQL更新,最好由另外一个工程师来把关
很多时候DBA并不知道SQL的业务含义,所以人工审核最好由其他研发工程师或研发经理来审核. 这是archer的设计理念 - 回滚数据展示
工单内可展示回滚语句,支持一键提交回滚工单 - 定时执行SQL
审核通过的工单可由DBA选择定时执行,执行前可修改执行时间,可随时终止 - pt-osc执行
支持pt-osc执行进度展示,并且可以点击中止pt-osc进程 - MySQL查询
库、表、关键字自动补全
查询结果集限制、查询结果导出、表结构展示、多结果集展示 - MySQL查询权限管理
基于inception解析查询语句,查询权限支持限制到表级
查询权限申请、审核和管理,支持审核流程配置,多级审核 - MySQL查询动态脱敏
基于inception解析查询语句,配合脱敏字段配置、脱敏规则(正则表达式)实现敏感数据动态脱敏 - 慢日志管理
基于percona-toolkit的pt_query_digest分析和存储慢日志,并在web端展现 - 邮件通知
可配置邮件提醒,对上线申请、权限申请、审核结果等进行通知
对异常登录进行通知 - 主库集群配置
- 用户权限配置
工程师角色(engineer)、审核角色(review_man)、DBA角色:
工程师可以发起SQL上线,在通过了inception自动审核之后,需要由其他研发工程师或研发经理来审核, 最后由DBA点击确认才能执行SQL
还有一个特殊的超级管理员即可以上线、审核,又可以登录admin界面进行管理 - 历史工单管理,查看、修改、删除
- 可通过django admin进行匹配SQL关键字的工单搜索
- 发起SQL上线,可配置的邮件提醒审核人进行审核
- 在发起SQL上线前,自助SQL审核,给出建议
- 支持手机端操作
- 合理的数据库设计和规范很有必要,尤其是MySQL数据库,内核没有oracle、db2、SQL Server等数据库这么强大,需要合理设计,扬长避短。互联网业界有成熟的MySQL设计规范,特此撰写如下。请读者在公司上线使用archer系统之前由专业DBA给所有后端开发人员培训一下此规范,做到知其然且知其所以然。
下载链接: https://github.com/jly8866/archer/blob/master/src/docs/mysql_db_design_guide.md
- archer/archer/settings.py
- 新增
增加DBA角色,SQL上线逻辑调整为:工程师提SQL->审核人审核->DBA执行,同时也支持DBA一个角色同时负责审核和执行
增加定时执行SQL工单,将审核和执行分离
增加SQL在线查询模块,支持查询权限申请、审核、管理,支持查询动态脱敏,保护隐私数据,可配置,默认不展示
增加SQL慢日志收集管理模块,可配置,默认不展示
增加SQL优化模块,基于SQLadvisor一键优化慢查询,可配置,默认不展示
增加阿里云RDS管理模块,管理RDS进程、慢查询、表空间信息,可配置,默认不展示
增加工单审核驳回备注,流程沟通更顺畅
增加SQL上传功能,提交工单更快速
增加全局异常日志捕获,方便定位问题
增加Dockerfile信息,自动构建最新docker镜像
- 优化
全局表格样式调整,显著提升显示性能,并且兼容手机等小屏设备
工单列表调整,支持工单名称和提交人搜索,列表性能优化
工单详情性能优化,解决提交语句过多可能造成服务崩溃的问题
图表展示优化,via绝望的生鱼片
登录时自动认证管理后台,避免二次登录
页面显示用户中文名
- 修复
修复SQL语句执行时间过长造成工单状态持续执行中的问题
调整回滚语句为倒序展示,避免提交回滚异常
- 克隆2.0分支代码到本地或者下载zip包
git clone -b archer-2.0 https://github.com/jly8866/archer.git
- 使用src/init_sql内的变更脚本变更数据库
v1.1.1分支请使用v1.1.1->v2.0.sql
master分支请使用nowmaster->v2.0.sql
2.0分支无需变更数据库 - 安装相关模块
pip3 install -r requirements.txt -i https://mirrors.ustc.edu.cn/pypi/web/simple/
- 初始化django-apscheduler相关表
python3 manage.py migrate
- 修改相关配置文件,启动
- docker镜像,参考wiki:
- docker镜像制作感谢@小圈圈 提供
- 可快速安装好archer环境,inception还需自行安装配置
centos7_install
- 环境准备:
(1)克隆代码到本地或者下载2.0分支zip包
git clone -b archer-2.0 https://github.com/jly8866/archer.git
(2)安装inception,项目地址 - 安装python3,版本号>=3.4:(由于需要修改官方模块,请使用virtualenv或venv等单独隔离环境!)
- 安装所需相关模块:
pip3 install -r requirements.txt
- MySQLdb模块兼容inception版本信息
使用src/docker/pymysql目录下的文件替换/path/to/python3/lib/python3.4/site-packages/pymysql/对应文件
-
创建archer本身的数据库表:
(1)修改archer/archer/settings.py所有的地址信息,包括DATABASES和INCEPTION_XXX部分
(2)通过model创建archer本身的数据库表python3 manage.py makemigrations sql python3 manage.py migrate
-
创建admin系统root用户(该用户可以登录django admin来管理model):
python3 manage.py createsuperuser
-
启动,有两种方式:
(1)用django内置runserver启动服务,建议不要在生产环境使用
bash debug.sh
(2)用gunicorn+nginx启动服务
安装模块pip3 install gunicorn==19.7.1
nginx配置示例server{ listen 9123; #监听的端口 server_name archer; proxy_read_timeout 600s; #超时时间与gunicorn超时时间设置一致,主要用于在线查询 location / { proxy_pass http://127.0.0.1:8888; proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header X-Forwarded-Proto $scheme; } location /static { alias /archer/static; #此处指向settings.py配置项STATIC_ROOT目录的绝对路径,用于nginx收集静态资源 } error_page 404 /404.html; location = /40x.html { } error_page 500 502 503 504 /50x.html; location = /50x.html { } }
启动
bash startup.sh
-
正式访问:
使用上面创建的管理员账号登录http://X.X.X.X:port/
- settings中QUERY改为True
- 到【后台数据管理】-【从库地址配置】页面添加从库信息
- 到【后台数据管理】-【工作流配置】页面配置审核流程
- 用户申请权限、审核通过后即可进行在线查询
- 如需要使用动态脱敏,请将settings中DATA_MASKING_ON_OFF改为True,并且到【后台数据管理】-【脱敏配置】页面配置脱敏规则和字段
-
settings中SLOWQUERY改为True
-
安装percona-toolkit(版本>3.0),以centos为例
yum -y install http://www.percona.com/downloads/percona-release/redhat/0.1-3/percona-release-0.1-3.noarch.rpm yum -y install percona-toolkit.x86_64
-
使用src/script/mysql_slow_query_review.sql创建慢日志收集表到archer数据库
-
将src/script/analysis_slow_query.sh部署到各个监控机器,注意修改脚本里面的
hostname="${mysql_host}:${mysql_port}"
与archer主库配置信息一致,否则将无法筛选到相关记录
- 安装SQLAdvisor,项目地址
- 修改配置文件SQLADVISOR为程序路径,路径需要完整,如'/opt/SQLAdvisor/sqladvisor/sqladvisor'
- 修改配置文件ALIYUN_RDS_MANAGE=True
- 安装模块
pip3 install aliyun-python-sdk-core==2.3.5
pip3 install aliyun-python-sdk-core-v3==2.5.3
pip3 install aliyun-python-sdk-rds==2.1.1
- 在【后台数据管理】-【阿里云认证信息】页面,添加阿里云账号的accesskey信息,重新启动服务
- 在【后台数据管理】-【阿里云rds配置】页面,添加实例信息,即可实现对阿里云rds的进程管理、慢日志管理
- patch目录下,名称为:django_1.8.17_admin_secure_archer.patch
- 使用命令:
patch python/site-packages/django/contrib/auth/views.py django_1.8.17_admin_secure_archer.patch
- 修改配置文件ENABLE_LDAP=True,安装相关模块,可以启用ldap账号登陆,以centos为例
yum install openldap-devel
pip install django-auth-ldap==1.3.0
- 如果使用了ldaps,并且是自签名证书,需要打开settings中AUTH_LDAP_GLOBAL_OPTIONS的注释
- settings中以AUTH_LDAP开头的配置,需要根据自己的ldap对应修改
- 工单展示页
- 自助审核SQL
- 提交SQL工单
- SQL自动审核、人工审核、执行结果详情页:
- 用户登录页
- 工单统计图表
- pt-osc进度条,以及中止pt-osc进程按钮
- SQL在线查询、自动补全
- 动态脱敏
- SQL在线查询日志
- SQL在线查询权限申请
- SQL慢查日志统计
- SQL慢查日志明细、SQLAdvisor一键优化
- SQLAdvisor
- 阿里云RDS进程管理、表空间查询
- 后台数据管理
- 权限审核配置
- 脱敏规则配置
QQ群:524233225
- runserver/debug.sh启动
settings里面关闭了debug,即DEBUG = False,需要在启动命令后面增加 --insecure,变成
python3 manage.py runserver 0.0.0.0:9123 --insecure
- nginx+gunicorn/startup.sh启动
nginx的静态资源配置不正确
location /static {
alias /archer/static; #此处指向settings.py配置项STATIC_ROOT目录的绝对路径,用于nginx收集静态资源,一般默认为archer按照目录下的static目录
}
- 偶现添加用户报错
采用nginx+gunicorn/startup.sh启动,多worker的部署,目前问题没有解决,可使用非save按钮进行添加 - 无法登录(确认用户名和密码正确)
检查用户is_active字段是否为1,django自带认证默认is_active约束是否可以登录前台,is_status约束是否可以登录后台管理
-
集群不显示数据库
archer会默认过滤一些系统数据库,过滤列表为'information_schema', 'performance_schema', 'mysql', 'test', 'sys'
主库配置的用户名或密码错误 -
审核人不显示 不能提交给自己审核,即使当前登录人是审核人/DBA
没有审核人/DBA角色的有效用户 -
检测SQL报错
3.1. invalid literal for int() with base 10:'Inception2'
调整pymysql使其兼容Inception版本信息,
使用src/docker/pymysql目录下的文件替换/path/to/python3/lib/python3.4/site-packages/pymysql/目录下的文件
3.2. invalid source infomation
inception用来审核的账号,密码不能包含*
3.3. Must start as begin statement
python3的pymysql模块会向inception发送SHOW WARNINGS语句,导致inception返回一个"Must start as begin statement"错误被archer捕捉到报在日志里
使用src/docker/pymysql目录下的文件替换/path/to/python3/lib/python3.4/site-packages/pymysql/目录下的文件
3.4. Incorrect database name ''
inception检查不支持子查询
3.5. Invalid remote backup information
inception无法连接备份库
- 检查配置文件里面inception相关配置
- 检查inception审核用户和备份用户权限,权限参考
— inception备份用户
GRANT SELECT, INSERT, CREATE ON *.* TO 'inception_bak'
— inception审核用户(各个业务实例)
GRANT SELECT, INSERT, UPDATE, DELETE, CREATE, DROP, ALTER,REPLICATION CLIENT,REPLICATION SLAVE ON *.* TO 'inception'
— archer在线查询用户
GRANT SELECT ON *.* TO 'archer_read'
- 检查binlog格式,需要为ROW,binlog_row_image为FULL
- 检查DML的表是否存在主键
- 检查语句是否有影响数据
- 未执行
检查django-apscheduler相关表是否有创建,可使用python3 manage.py migrate
创建