当前位置: 首页 > news >正文

网站建设的完整流程图有没有傻瓜式建设网站

网站建设的完整流程图,有没有傻瓜式建设网站,注册安全工程师白考了,做类似起点的网站datax可以理解为sqoop的优化版, 速度比sqoop快 因为sqoop底层是map任务,而datax底层是基于内存 DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定…

datax可以理解为sqoop的优化版,

速度比sqoop

因为sqoop底层是map任务,而datax底层是基于内存

DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能

datax 是让你编写 json

flume 是让你编写 conf

azkaban 是让你编写 flow

sqoop 是让你写命令

将mysql中的数据导入到hdfs上

{"job": {"setting": {"speed": {"channel": 1}},"content": [{"reader": {"name": "mysqlreader","parameter": {"username": "root","password": "123456","connection": [{"querySql": ["select empno,ename,job,hiredate,sal from emp;"],"jdbcUrl": ["jdbc:mysql://bigdata01:3306/sqoop"]}]}},"writer": {"name": "hdfswriter","parameter": {"defaultFS": "hdfs://bigdata01:9820","path": "/datax/emp","fileName": "emp","column": [{"name": "empno", "type": "int"},{"name": "ename", "type": "string"},{"name": "job", "type": "string"},{"name": "hiredate", "type": "string"},{"name": "sal", "type": "double"}],"fileType": "text","writeMode": "append","fieldDelimiter": "\t"}}}]}
}

将hdfs上的数据导入到mysql中

{"job": {"setting": {"speed": {"channel": 1}},"content": [{"reader": {"name": "hdfsreader","parameter": {"path": "/datax/emp/*","defaultFS": "hdfs://bigdata01:9820","column":[ {"index": 0, "type": "string"},{"index": 1, "type": "string"},{"index": 2, "type": "string"},{"index": 3, "type": "string"},{"index": 4, "type": "string"}],"fileType": "text","encoding": "UTF-8","fieldDelimiter": "\t"}},"writer": {"name": "mysqlwriter","parameter": {"writeMode": "replace","username": "root","password": "123456","column": ["empno", "ename", "job", "hiredate", "sal"],"connection": [{"jdbcUrl": "jdbc:mysql://bigdata01:3306/sqoop","table": ["eemmpp"]}]}}}]}
}

使用注意

注意点:

1)指定字段的类型时,datax中的类型只有下面几种,而不是像java一样的

2)默认的分隔符,即 "fieldDelimiter": "xxx" 不指定或者不写的时候,默认为 ' , ' 分割

3)

将mysql 中的数据导入hive(重要)*

说是把mysql中的数据导入hive,其实本质还是将mysql中的数据导入hdfs中

首先先创建一个hive表 指定到hdfs的路径上,再将mysql中的数据导入到这个路径即可

1)首先先创建一个hive表
 

reate external table if not exists ods_01_base_area ( id int COMMENT 'id标识', area_code string COMMENT '省份编码', province_name string COMMENT '省份名称', iso string COMMENT 'ISO编码' )row format delimited fields terminated by ',' stored as TextFile location '/data/nshop/ods/ods_01_base_area/'; -- 指定到hdfs的路径

2)将mysql的数据通过datax导入hdfs

注意指定路径和分隔符 ! 一定要与创建hive表指定的路径一致 且 分隔符也保持一致

{"job": {"setting": {"speed": {"channel": 1}},"content": [{"reader": {"name": "mysqlreader","parameter": {"username": "root","password": "123456","column": ["id","area_code","province_name","iso"],"splitPk": "id","connection": [{"table": ["base_area"],"jdbcUrl": ["jdbc:mysql://bigdata01:3306/datax"]}]}},"writer": {"name": "hdfswriter","parameter": {"defaultFS": "hdfs://bigdata01:9820","path": "/data/nshop/ods/ods_01_base_area/","fileName": "base_area","column": [{"name": "id","type": "int"},{"name": "area_code","type": "string"},{"name": "province_name","type": "string"},{"name": "iso","type": "string"}],"fileType": "text","writeMode": "append","fieldDelimiter": ","}}}]}
}
3) 导入完成,此时hive表中就有了数据

http://www.yayakq.cn/news/952292/

相关文章:

  • 网站如何提高用户量建立网站的链接结构有哪几种形式?简述其各自的优缺点
  • 浙江省网站建设公司排名天元建设集团有限公司大股东
  • 谷城网站定制阿里云备案网站 网站名称怎么写
  • wordpress 企业站模版只做网站的
  • 外国网站上做雅思考试金华免费模板建站
  • 小地方的旅游网站怎么做关键词排名查询官网
  • 网站搭建哪里找最好如何制作统计小程序
  • win 2008 iis建立网站商标设计网站提供哪些服务
  • 徐州最好网站建设电影网站建设哪家便宜
  • 织梦网站模板做的网站有哪些长沙县建设局网站
  • 网站备案号 有效期app软件开发策划书
  • 广饶县住房和城乡建设局网站云速建站与传统网站的区别
  • 杭州seo网站哪家好进地铁建设公司网站
  • 建设银行住房公积金预约网站国际跨境电商有哪些平台
  • 网站开发报价明细表简阳电力建设立项网站
  • 织梦网站安装dir汕头百度网络推广
  • wordpress代理管理多站点实训小结网站建设
  • 英文案例网站企业信用公示信息网
  • wordpress网站接入qq建设一个网站的基本步骤
  • 津南区提供网站建设协议网页设计工作怎么样
  • 做宣传册网站网页版梦幻西游奔波儿灞
  • 做网站需要多大的内存粤嵌培训机构官网
  • 网站制作哪里好写的网站怎么做接口
  • 中山网站建设电话流量卡分销代理平台
  • 做网站前期创建文件夹个人网站建设设计
  • 做网站的软件有些什么博客个人目录wordpress
  • 个人网站注册公司西安做网站
  • 宁波网站建设最好WordPress目录和连接关系
  • 洛南网站建设wordpress免费商城模板
  • 丰台做网站的公司网络推广公司名称