刚来公司的第二天做的事就是把cd的数据导到bj来,因为不能按照原来一模一样的去导所以就用到了datax,而datax帮我搞定了这个难题,有道是花时间想办法解决,不如找工具研究。


首先我们得先下载datax
https://github.com/alibaba/DataX
下面开始
解压到虚拟机上 tar -zxvf datax.tar.gz 修改权限为755 进入bin
目录即可操作同步作业

tar zxvf datax.tar.gz
 sudo chmod -R 755 {YOUR_DATAX_HOME}
 cd  {YOUR_DATAX_HOME}/bin
 python datax.py ../job/job.json

把写好的配置文件(eg:cdshop2bjshop)放到 bin目录下
把写好的配置文件(eg:cdshop2bjshop)放到 bin目录下
修改配置文件的地址
修改配置文件的地址
运行命令 在bin目录下 python datax.py cdshop2bjshop(配置文件)成功后会显示如下内容
success
详细:https://github.com/alibaba/DataX

需要注意俩表同步之间 字段名可以不同 但字段数量和类型必须一样


因dataX其内部庞大,所以建议了解后,去攻读源代码,在github上,链接就给大家了,有什么疑问可以给我留言,我是黑猫,我在这里。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐