当前位置: 首页 > news >正文

免费个人网站注册企业管理公司介绍

免费个人网站注册,企业管理公司介绍,苏州网站建设网络,建e网室内设计图📑 DataX和dataX-web 集群部署及使用 一 . 安装前准备 DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。 DataX 采用 框架 插件 的模式…

📑 DataX和dataX-web 集群部署及使用

一 . 安装前准备

DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。

DataX 采用 框架 + 插件 的模式:

  • 插件只需关心数据的读取或者写入本身
  • 同步时的共性问题,如 类型转换,性能,统计 由框架来处理

开发插件时 只需要关注两个问题:

  • 数据源本身读写的数据正确性
  • 如何与框架沟通,合理正确地使用框架

逻辑执行模型:

  • Job:是DataX描述一个源头到一个目的端的同步作业,是DataX数据同步的最小业务单元。如将一张mysql表同步到odps一个表的分区
  • Task:是Job拆分得到的最小执行单元。如在同步一张1024哥分表的mysql分库分表的Job时,就可拆分成1024个读Task并发执行
  • TaskGroup:一组Task集合,在同一个TaskGroupContainer执行下的Task集合
  • JobContainer:Job执行器,负责job全局拆分,调度,前置语句和后置语句等工作的工作单元。类似Yarn中的JobTracker 调度Job的每一个子任务task运行于TaskTracker上
  • TaskGroupContainer:TaskGroup的执行器,负责一组Task的工作单元。类似Yarn中的TaskTrackerTaskTracker主动与JobTracker通信,接收作业,并负责直接执行每一个任务。

框架为插件提供物理上的执行能力(线程)。框架有三种运行模式

  • Standalone:单线程运行,没有外部依赖
  • Local:单线程运行,统计信息,错误信息汇报到集中存储
  • Distributed:分布式多线程运行,依赖 DataX Service 服务

当 JobContainer和TaskGroupContainer 运行在同一个进程内时,就是单机模式(Standalone和local);当他们分布在不同的进程中执行就是分布式(distributed)

datax-web 集群部署时单独起某一个功能 ./bin/start.sh -m datax-executor

datax二次开发

datax源码学习

datax二次开发打包

dataX、dataX-web安装部署 dataX集群模式

二 . 配置datax和datax-web

1 安装dataX

使用源码自定义打包

链接 datax 源码

 mvn -U clean package assembly:assembly -Dmaven.test.skip=true

路径在 /target/datax/datax/ 下面

(需要python环境及maven环境)

#测试命令
python bin/datax.py job/job.json 

在这里插入图片描述

ps.如果是自己新增插件 需要修改项目中的 package.xmlpom.xml

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

2 安装datax-web

https://github.com/WeiYe-Jing/datax-web/blob/master/doc/datax-web/datax-web-deploy.md

https://github.com/WeiYe-Jing/datax-web/blob/master/userGuid.md

datax-web集群部署 一个datax-web和多个datax-executor。确认datax安装的路径都是一样

启动datax-executor命令

./bin/stop.sh -m datax-executor

在这里插入图片描述

在这里插入图片描述

通过 module 下的 bin 下的日志能查到日志文件

在这里插入图片描述

1、通过界面的执行器管理能查到

在这里插入图片描述

2、data-web使用

data-web 的任务构建是负责自动生成dataX用的json文件,如果已经有json文件 就不需要使用。

3、data-web简要使用
  • 新建项目管理

在这里插入图片描述

  • 查看执行器管理
    在这里插入图片描述

  • 新建 任务管理
    在这里插入图片描述

  • 执行任务、查看日志

在这里插入图片描述

在这里插入图片描述

4、报错小记

在读mysql报错
在这里插入图片描述

在jdbc url增加配置 在没有服务器身份验证的情况下建立SSL连接\设置useSSL=false来显式禁用SSL

jdbc:mysql://hostname:port/tsp-cloud?useSSL=false&useUnicode=true&characterEncoding=utf8

rl增加配置 在没有服务器身份验证的情况下建立SSL连接\设置useSSL=false来显式禁用SSL

jdbc:mysql://hostname:port/tsp-cloud?useSSL=false&useUnicode=true&characterEncoding=utf8
http://www.yayakq.cn/news/475058/

相关文章:

  • 江西南昌网站建设招标好玩的html代码
  • 怎么在vk网站上做推广楚雄网站建设rewlkj
  • 太平洋在线建站系统wordpress首页空白
  • 广东工程承包网站医疗网站专题怎样做
  • 网站分哪些类型查询网ip138子域名
  • 如何对网站做实证分析wordpress流量统计插件
  • 做鞋子出口需要作网站吗策划公司怎么找客户
  • 新民正规网站建设价格咨询给wordpress配置域名
  • 阜阳微商城网站建设加强校园网站建设
  • wex5网站开发南京网站建设招聘
  • 企业网站网页设计的步骤中小企业网络营销论文
  • 移动端网站欣赏培训网网站源码
  • 装饰公司营销网站建设wp如何做网站地图
  • 广州网站建设找新际做的网站提示不安全问题
  • 微信 网站 优劣势品牌网站建设哪里有
  • 张店低价网站建设广告投放运营主要做什么
  • 投资者教育网站建设制作网页创建站点的步骤
  • 学校做的网站外面访问不了焦作做微信网站多少钱
  • 网站关键词密度怎么计算的h5成品网站
  • 分类网站营销企业邮箱地址怎么注册
  • 网站中备案与不备案的区别福州软件网站开发培训班
  • wordpress 名站大连 做 企业网站
  • 一个虚拟主机绑定2个网站霸州做网站
  • c 做网站流程企业网页制作心得
  • 安义南昌网站建设公司led灯网站建设案例
  • 长沙创意网站建设电商入门视频教程免费
  • 固镇网站建设哪家好?智能家居网站建设方案
  • 百度提交网站阜阳网站开发公司
  • 兰州怎么提高网站的排名博客建站模板
  • 北京交通管制信息网站自驾游黄山风景区旅游攻略