godbart

command module

v0.9.2 Latest Latest Go to latest Published: Dec 10, 2018 License: Apache-2.0 Imports: 9 Imported by: 0

Details

Valid go.mod file
Redistributable license
Tagged version
Stable version
Learn more about best practices

Repository

github.com/trydofor/godbart

Links

Open Source Insights

README ¶

godbart - go-db-art

  |^^^^^^|    /god-bark/ 是一个go写的
  |      |    基于SQL的数据库运维命令行
  | (o)(o)    □ 多库执行，版本管理
  @      _)   □ 比较表、索引、触发器差异
   | ,___|    □ 以业务`数据树`提取数据
   |   /      □ 纯SQL写`数据树`的配置

使用场景的前置要求，

DBA维护多库，一个SQL在多库上执行。
生成某库某表的创建SQL（表，所以，触发器）。
对比不同库间表结构差异（表，列，索引，触发器）。
多库的版本管理，更新到指定版本。
导出数据，保持CSV/TSV文件。
迁移数据树，主键有分布式特征，无自增型。
当前只适配了MySql，可自行实现PG版。
SQL语句，必须有结束符，如;，否则认为是一组。

数据数(DataTree) 指因为业务逻辑（非强外键关系）形成的数据依赖关系。比如demo/init/2.data.sql中的关系，存在以下多个1:N关系。

|-(TOP)-收件人(tx_receiver)
|      |-(1:N)-包裹(tx_parcel)
|      |      |-(1:N)-物流(tx_track)
|      |      |-(1:N)-事件(tx_parcel_event)
|      |      |-(1:N)-历史(tx_parcel$log)

可以形成以收件人为根的树，也可以从包裹为根，形成数据树。

开发和测试环境，ubuntu 16.04

Go 1.11.2
MySQL (5.7.23)

1.执行脚本 Exec

在不同的db上，纯粹的批量执行脚本。

# 执行 demo/sql/init/的`*.sql`和`*.xsql`
./godbart exec \
 -c godbart.toml \
 -d prd_main \
 -d prd_2018 \
 -x .sql -x .xsql \
 demo/sql/init/

其中，exec 命令，会把输入的文件或路径，分成SQL组，执行。

-c 必填，配置文件位置。
-d 必填，目标数据库，可以指定多个。
-x 选填，SQL文件后缀，不区分大小写。
--agree 选填，风险自负，真正执行。

2.版本管理 Revi

数据库需要有版本管理时。通常，使用一个表，记录版本号，以识别和对比。 Revi只考虑Up不考虑Down。如果需要Down时，以负向补丁形式进行Up。

# 执行 demo/sql/revi/*.sql，具体SQL写法参考此目录的文件
./godbart revi \
 -c godbart.toml \
 -d prd_main -d prd_2018 \
 -r 2018111701 \
 -m 'v_[0-9]{10,}'
 -x .sql -x .xsql \
 demo/sql/revi/

其中，revi 命令，会把输入的文件或路径的SQL进行按版本号分组。

-c 必填，配置文件位置。
-d 必填，目标数据库，可以指定多个。
-r 必填，执行到的版本号。
-m 选填，更新版本语句的Revision正则，默认10位以上数字。
-q 选填，查询版本语句的前缀，SELECT 不区分大小写。
-x 选填，SQL文件后缀，不区分大小写。
--agree 选填，风险自负，真正执行。

版本号要求，

全局必须唯一且递增，但不要求连续。
能以字符串方式比较大小，如日期+序号：yyyymmdd###。
具有可以用正则匹配提取的固定格式。

版本管理的SQL有特别的要求，必须被版本查询和版本更新的SQL包围。因此，SQL文件中，首个SELECT和最尾的Execute，视为版本查询和更新的SQL。

作为参数传入的版本文件，版本号需要递增，否则报错（只检查，不排序）。

-- 创建version表 # 此时没有版本查询，但在之前，因此会被执行
CREATE TABLE `sys_schema_version` (
  `version` BIGINT NOT NULL COMMENT '版本号',
  `created` DATETIME NOT NULL COMMENT '创建时间',
  PRIMARY KEY (`version`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;

-- 版本查询
SELECT max(version) FROM sys_schema_version;

ALTER TABLE `tx_outer_trknum`
  ADD COLUMN `label_file` VARCHAR(200) DEFAULT NULL COMMENT '面单文件位置' AFTER `trknum`;
ALTER TABLE `tx_outer_trknum$log`
  ADD COLUMN `label_file` VARCHAR(200) DEFAULT NULL COMMENT '面单文件位置' AFTER `trknum`;

-- 版本更新
REPLACE INTO sys_schema_version (version, created) VALUES( 2018022801, NOW());

3.结构对比 Diff

对一个或多个数据库的结构差异，能够生成创建SQL(DDL)，支持table&index，trigger。

过程信息使用log输出stderr(2)。结果信息使用stdout(1)输出。结果信息中，用>表示只有左侧存在，<表示只有右侧存在。

通过SHELL特性，可以有以下的信息分离方式。

> main-2018-diff-out.log 结果直接保存文件，控制台不输出。
2> main-2018-diff-err.log 过程保存文件，控制台不输出。
&> main-2018-diff-all.log 全部保存文件，控制台不输出。
| tee main-2018-diff-out.log 结果保存文件，且控制台输出。
2>&1| tee >(grep -vE '^[0-9]{4}' > main-2018-diff-out.log) 同上。
2>&1| tee main-2018-diff-all.log 全部保存文件，且控制台输出。

# 对表名，字段，索引，触发器都进行比较，并保存结果到 main-2018-diff-out.log
./godbart diff \
 -c godbart.toml \
 -s prd_main \
 -d prd_2018 \
 -k detail \
 'tx_.*' \
| tee main-2018-diff-out.log

-s 为左侧比较相，可以零或一。
-d 为右侧比较相，可以零或多。
-k 为比较类型，支持create的ddl，detail的表明细，tbname的仅表名。
- create 生成多库的创建DDL(table&index，trigger)
- detail 分别对比-s和多个-d 间的表明细(column, index,trigger)
- tbname 分别对比-s和多个-d 间的表名差异
--agree 选填，风险自负，真正执行。

参数为需要对比的表的名字的正则表达式。如果参数为空，表示所有表。 -s和-d，必须指定一个。只有一个时，仅打印该库，多个时才进行比较。

4.数据迁移 Tree

不建议一次转移大量数据，有概率碰到网络超时或内存紧张。

# 对表名，字段，索引，触发器都进行比较，并保存结果到 main-tree-out.log
./godbart tree \
 -c godbart.toml \
 -s prd_main \
 -d prd_2018 \
 -x .sql -x .xsql \
 -e "DATE_FROM=2018-11-23 12:34:56" \
 demo/sql/tree/tree.sql
 > main-tree-out.log

# 静态分析树结构
./godbart sqlx \
 -c godbart.toml \
 -e "DATE_FROM=2018-01-01 00:00:00" \
 demo/sql/tree/tree.sql \
 | tee /tmp/sqlx-tree.log

不同业务场景对数据活性有不同的定义，比如日期，按ID范围等。 Tree命令只支持静态分离数据，即在执行前已预知数据范围和目标数据库。因为动态分库，通常有业务代码负责，而不会沦落到"SQL+数据维护"的层面。此外，要求表的主键具有分布式主键特质（当前不支持单表自增型，破坏数据关系）

数据树(DataTree)的核心是占位。唯一的占位符，可以准确描述数据关系，可以满足基本的SQL语法。占位必须先声明再使用，以区别普通字面量。

-- 建立分库有关的表
CREATE TABLE `sys_hot_separation` (
  `table_name` VARCHAR(100) NOT NULL COMMENT '表名',
  `checked_id` BIGINT(20) NOT NULL COMMENT '检查过的最大ID',
  `checked_tm` DATETIME NOT NULL COMMENT '上次检查的时间',
  PRIMARY KEY (`table_name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;

分离数据的规则必须预先可知，如下脚本根据上次迁移ID，迁移10棵以tx_parcel为根的数据树。并每迁移一棵树，就会执行一次FOR，已完成此树的标记和清理工作。

-- REF checked_id 990001  #数据树根节点
SELECT checked_id FROM sys_hot_separation WHERE table_name = 'tx_parcel';

-- REF id 990002  #一级树节点990002，父节点是 990001
-- REF track_num 'TRK0001'  #提取结果中的id和track_num作为变量，形成数据树
SELECT * FROM tx_parcel WHERE id > 990001 LIMIT 10;

-- REF id 990003  #二级树节点990003，父节点是 TRK0001
SELECT * FROM tx_track WHERE track_num = 'TRK0001';

-- REF id 990004 #二级树节点990004，父节点是 990002
SELECT * FROM tx_parcel_event WHERE parcel_id = 990002;

-- RUN FOR 990002 #每棵990002树节点完成时，执行此语句
REPLACE INTO sys_hot_separation(table_name, checked_id, checked_tm) VALUES 
('tx_parcel', 990002, now());

5.指令变量

指令由SQL的单行注释定义，由变量para和占位hold构成。保留SQL的可读性和执行能力，对DBA友好，在运行时进行静态或动态替换。

数据树按SQL从上至下的顺序构建和执行，因此，变量和占位必须先声明再使用，否则无法正确识别占位符。

指令是固定值，当前只支持，ENV REF STR RUN OUT
- ENV REF STR 为定义指令。
- RUN OUT 为使用指令。
- ENV REF 对变量自动脱去最外层成对的引号。
- STR 有自己的脱引号规则，以进行模式展开。
引号包括，单引号'，双引号"，反单引号`。
空白指英文空格0x20和制表符\t
变量和占位要求相同，都区分大小写。
- [^ \t'"`]+ 连续的不包括引号和空白的字符串。
- (['"`])[^\1]+\1成对引号括起来的字符串(非贪婪)。
占位，在SQL语句符合语法的字面量（数字，字符串，语句等）。
- 必须当前SQL中全局唯一，不与其他字面量混淆，以准确替换，确定数据关系。
- 尽量使用SQL的合规语法，没必要自找麻烦，比如没必要的引号或特殊字符。
- 使用时，保留所有引号。
- 选择占位，尽量构造出where条件为false的无公害SQL。

5.1.环境变量 ENV

ENV通过 -e MY_ENV="my val"传入，全局有效。当只有Key表示使用系统变量，如 -e PATH，系统内置了以下变量

USER，当前用户
HOST，主机名
DATE，当前日时(yyyy-mm-dd HH:MM:ss)
ENV-CHECK-RULE，ENV检查规则，默认ERROR：报错；EMPTY：置空；

如下SQL，定义环境变量DATE_FROM，其占位符'2018-11-23 12:34:56' ，需要通过系统环境变量获得，如果不存在（默认ERROR）则会报错。

假设运行时 DATE_FROM的值为'2018-01-01 00:00:00'，那么上述SQL执行时为，是采用PreparedStatement的动态形式，以防止SQL转义或注入。

-- ENV DATE_FROM '2018-11-23 12:34:56'
SELECT * FROM tx_parcel WHERE create_time = '2018-11-23 12:34:56';

-- 运行时替换，比如实际参数为'2018-01-01 00:00:00'
-- SELECT * FROM tx_parcel WHERE create_time = ?

5.2.结果引用 REF

REF 也采用PreparedStatement替换，并对所在结果集的每条记录循环。多个REF会产生多个分叉点，进而形成不同的子数据树。

当子语句，只依赖一个REF的占位(如9900397)时，相当于RUN FOR 9900397，因为时唯一关系，所以可以省略RUN/OUT，两者时等价的。

当子语句，会依赖多个REF的占位(如9900398,9900399)时，为了避免歧义，必须使用 RUN/OUT精确描述，否则系统会任性选择。

如下SQL，定义了结果集的引用 id和track_num变量，和他们对应的SQL占位符。其中，id和track_num，都是tx_parcel的结果集中，用来描述数据树。

-- ENV DATE_FROM '2018-11-23 12:34:56'
-- REF `id` 1234567890  #假设id需要反单引号处理
-- REF track_num 'TRK1234567890'
SELECT * FROM tx_parcel WHERE create_time = '2018-11-23 12:34:56';

SELECT * FROM tx_track WHERE track_num = 'TRK1234567890';

SELECT * FROM tx_parcel_event WHERE parcel_id = 1234567890;

系统为SELECT * 内定了结果集引用，以便可以构建insert和update语句。

COL[] 表示所有列名，会展开为 id,name,等（可以转义）
VAL[] 表示结果的值，会展开为 ?占位符和对应值。
COL[1] 表示获得第1个列名
VAL[2] 表示获得第2个值

其中，角标从1开始。引用为数组时，[]内指定分隔符，默认是,。

COL[]和COL[,]相同。
存在多个分隔符时，只取第一个非空的。
不能用数字，因为做角标
不能用[或]，因为你懂的。
仅支持\\，\t，\n的字符转义。

5.3.静态替换 STR

STR与ENV和REF不同，采用的是静态替换字符串。可以对结果集或占位符使用。 STR可以直接定义（同REF和ENV），也以对其他占位重新定义。

脱引号处理，当变量和占位具有相同的引号规则，则同时脱去最外的一层引号。此规则只对STR有效，因为其变量部分，可以重定义带有引号的占位。

模式展开，变量中有COL[*]或VAL[*]时，会进行展开。

首先脱引号处理。
只支持直接定义，不支持重新定义。
除了COL[*]和VAL[*]外，都作为字面量处理，不会深度展开。
COL[*]部分，使用静态替换。
VAL[*]部分，使用PreparedStatement形式执行。

-- REF Y4 '2018-00-00 00:00:00'
SELECT year(now()) as Y4;

-- STR '2018-00-00 00:00:00' $y4_table   #重新定义，以使SQL语法正确。
CREATE TABLE tx_parcel_$y4_table LIKE tx_parcel;
-- 替换后
CREATE TABLE tx_parcel_2018 LIKE tx_parcel;

-- STR COL[1] $COL1  #直接定义。
-- STR "`COL[]` = VAL[]" "logno = -99009"  #直接定义，脱引号，模式展开。
-- REF VAL[1] '占位值'
-- REF id 990001
SELECT * FROM tx_parcel WHERE create_time = '2018-11-23 12:34:56';

INSERT INTO tx_parcel (`$COL1`) VALUES ('占位值');
-- 替换后
INSERT INTO tx_parcel (`id`) VALUES ('占位值');

UPDATE tx_parcel SET logno = -99009 WHERE id=990001;
-- 替换后
UPDATE tx_parcel SET `id` = ? ,`create_time` = ? /*循环加下去，逗号分割*/ WHERE id=990001;

5.4.条件执行 RUN

执行条件由REF或ENV定义，只对所在的语句有效。

FOR 以定义占位的节点为根，每棵树结束时执行。等效于Hold依赖关系。
ONE 以定义占位的节点为根，第一棵树时执行。
END 以定义占位的节点为根，最后一棵树时执行。
HAS 表示占位变量有值时执行。有值指，
- 数值大于0
- 布尔true
- 非NULL
- 字符串非空（“”）
- 其他类型强转为字符串后非空。
NOT 与HAS相反。

条件执行，有以下约定关系，

多个ONE|FOR|END是OR关系。
HAS|NOT自身或与其他是AND关系。
RUN 可以确定多个父关系，且强于REF。
RUN 在树结束时执行，而REF在树中执行。
数据点增序排列，权重为REF<ONE<FOR<END，同级时算SQL位置。

条件执行的例子，参考 demo/sql/tree/*.sql

5.5.输出执行 OUT

与条件执行 RUN 一样的定义，但不在源DB上执行，而是在目标DB上执行。

注意，在有定义Def语句（REF或STR直接定义）时，不能使用OUT。因为一个占位在运行时存在多值，从而导致语义混乱或执行时麻烦。

-- ENV DATE_FROM '2018-11-23 12:34:56'
-- REF id 1234567890
SELECT * FROM tx_parcel WHERE create_time = '2018-11-23 12:34:56';

-- OUT FOR 1234567890
REPLACE INTO tx_parcel VALUES(1234567890);

6.测试手册

使用工程中/demo/sql下的SQL进行所有功能的演示和测试。以下是准备工作，你必须都懂。注意，所有对数据库有写操作的命令，都需要增加--agree才会执行，否则仅输出预计结果。

6.1. 获得执行文件

### 方法一：下载 ###
# 直接下载release文件，直接到unzip步骤
# https://github.com/trydofor/godbart/releases

### 方法二：编译 ###

git clone https://github.com/trydofor/godbart.git
cd godbart

# 单平台编译
GOOS=linux GOARCH=amd64 go build

# 或全平台发布
chmod +x build.sh
./build.sh

ls -l release 
# 解压对应系统的执行文件，默认linux
unzip release/godbart-linux-amd64.zip

# 得到 godbart 程序

6.2. 修改数据源配置

修改godbart.toml中的数据库用户名，密码，主机，端口等

# 你的用户是 yourname
sed -i 's/trydofor:/yourname:/g' godbart.toml
# 你的密码是 yourpass
sed -i 's/:moilioncircle@/:yourpass@/g' godbart.toml
# 你的ip是 127.0.0.9
sed -i 's/(127.0.0.1:/(127.0.0.9:/g' godbart.toml
# 你的端口是 13306
sed -i 's/:3306)/:13306)/g' godbart.toml

6.3. 创建数据库

# 存在一个可使用的数据库，如一般都有的test
./godbart exec \
 -c godbart.toml \
 -d lcl_test \
 --agree \
 demo/sql/diff/reset.sql
 
 # 或用 mysql命令，创新数据库
 cat demo/sql/diff/reset.sql \
 | mysql -h127.0.0.1 \
 -utrydofor \
 -P3306 \
 -p"moilioncircle"

6.4. Exec 执行脚本

使用 exec 执行init中的脚本初始化 prd_main 数据库。

./godbart exec \
 -c godbart.toml \
 -d prd_main \
 --agree \
 demo/sql/init/

6.5. Revi 版本控制

执行revi中的脚本使 prd_2018 更新到 2018111103 版本（只有结构没有数据）。因为prd_main 版本号比 2018111103 所以会跳过小版本的更新。

./godbart revi \
 -c godbart.toml \
 -d prd_main \
 -d prd_2018 \
 -r 2018111103 \
 --agree \
 demo/sql/revi/

6.6. Diff 结构差异

使用 diff 执行比较 prd_main 与 prd_2018, dev_main 差异。

# 查看 prd_main 与 dev_main的表名差异（默认）
./godbart diff \
 -c godbart.toml \
 -s prd_main \
 -d dev_main
 
# 显示 tx_parcel表在prd_main上的创建语句
./godbart diff \
 -c godbart.toml \
 -s prd_main \
 -k create \
  tx_parcel \
| tee /tmp/ddl-tx_parcel-main.sql

# 比较 tx_parcel 在prd_main和prd_2018详细差异
./godbart diff \
 -c godbart.toml \
 -s prd_main \
 -d prd_2018 \
 -k detail \
  tx_parcel \
| tee /tmp/diff-tx_parcel-main-2018.sql

6.7. SqlX 静态分析

静态分析 DataTree结构。

./godbart sqlx \
 -c godbart.toml \
 -e "DATE_FROM=2018-01-01 00:00:00" \
 demo/sql/tree/tree.sql \
 | tee /tmp/sqlx-tree.log

6.8. Tree 保存JSON

把数据，保持成TSV（TAB分割），CSV（逗号分割）和JSON。此例中，有脱引号，模式展开 的组合。

# 危险动作，先保持日志查看
./godbart tree \
 -c godbart.toml \
 -s prd_main \
 -e "DATE_FROM=2018-01-01 00:00:00" \
 demo/sql/tree/json.sql \
 | tee /tmp/tree-main-json.log
 
#分离和处理，去掉注释和结束符
cat /tmp/tree-main-json.log \
| grep -E '^--' | grep -vE  "^(-- )+(SRC|OUT)" \
| sed -E 's/^-- |;$//g' \
| tee /tmp/tree-main-json.txt

6.9. Tree 迁移数据

此例中，因为危险操作比较多，务必先分离脚本，人工确认。脚本99%可以执行，在二进制或转义字符转换字面量可能有遗漏。

字面量不好描述的类型，可--agree，在程序中以动态数据来执行。

# 危险动作，先保持日志查看
./godbart tree \
 -c godbart.toml \
 -s prd_main \
 -d prd_2018 \
 -e "DATE_FROM=2018-01-01 00:00:00" \
 demo/sql/tree/tree.sql \
2>&1| tee /tmp/tree-main-2018-all.log
 
# 获得全部SQL
cat /tmp/tree-main-2018-all.log \
| grep -vE '^[0-9]{4}/[0-9]{2}|^$' \
| tee /tmp/tree-main-2018-all.sql

# 获得源库SQL
cat /tmp/tree-main-2018-all.sql \
| grep -E '^[^-]|-- SRC' \
| tee /tmp/tree-main-2018-src.sql

# 获得目标库SQL
cat /tmp/tree-main-2018-all.sql \
| grep -E '^--' | cut -c 4- | grep -v  "-- SRC" \
| tee /tmp/tree-main-2018-out.sql

# 直接执行
./godbart tree \
 -c godbart.toml \
 -s prd_main \
 -d prd_2018 \
 -e "DATE_FROM=2018-01-01 00:00:00" \
 --agree \
 demo/sql/tree/tree.sql \
2>&1| tee /tmp/tree-main-2018-all.log

Documentation ¶

There is no documentation for this package.

Source Files ¶

View all Source files

main.go

Directories ¶

Path	Synopsis
art

?	: This menu
/	: Search site
f or F	: Jump to
y or Y	: Canonical URL