当前位置: 首页 > news >正文

国内免费工厂网站建设wordpress 文章主题图

国内免费工厂网站建设,wordpress 文章主题图,网站建设页面底部叫什么,免费微信微网站模板下载#1.数据倾斜 什么是数据倾斜? 一部分数据多 一部分数据少 造成的结果: MR运行过慢 主要是shuffle和reduce过程慢 分组聚合导致数据倾斜 Hive未优化的分组聚合 方法1:在MAP端直接聚合(分组聚合优化),减少…

#1.数据倾斜
什么是数据倾斜?
一部分数据多
一部分数据少
造成的结果: MR运行过慢 主要是shuffle和reduce过程慢

分组聚合导致数据倾斜

Hive未优化的分组聚合
在这里插入图片描述
方法1:在MAP端直接聚合(分组聚合优化),减少Key
MR失败

方法2:随机数,按随机数放入reduce中 解决数据倾斜 第二个Jobs按分组字段分区
因为生成随机了,所以按

方法1和方法2 一起用是不影响的
先进行聚合 然后按随机数分配reduce 再启动一个job dierge job 按分组字段分区

join的数据倾斜
最后根据KEY进行分组
在这里插入图片描述
这里的数据倾斜的现象和影响是什么呢?
1.map join
2. skew join
牺牲一个job为代价解决
将产生数据倾斜的Key去单独跑一个job
其实就是啥, map将大K提出来重新一个job ,剩下的直接生成结果集,然后job2的结果最后也注入结果集
根据参数判断
在这里插入图片描述
这里晚点多看一下
大表Join 对倾斜Key的表的key打散,对关联的另一张表的key扩容
为什么????

reduce 并行度
可以指定并行度,也可以自动
可以设置最大值
为什么最大默认1009
在这里插入图片描述

可以设置reduce task数据量 估算Reduce并行度

reduce task量与数据量相关合理么?
不合理,因为收到的是map处理后的数据,有可能已经变小很多了,在reduce端小文件
但是无法获取map的数据量

在这里插入图片描述
3表join OBC如何优化?
在这里插入图片描述
在这里插入图片描述
优化后: 先进行小表合并,

谓词下推
谓词下推(predicate pushdown)是指,尽量将过滤操作前移,以减少后续计算步骤的数据量。
CBO优化也会完成一部分的谓词下推优化工作,因为在执行计划中,谓词越靠前,整个计划的计算成本就会越低。
–是否启动谓词下推(predicate pushdown)优化
set hive.optimize.ppd = true;
白话:
在这里插入图片描述
谓词下推:先执行过滤条件再执行join

在这里插入图片描述

hive本地模式
在这里插入图片描述
开启自动转换模式
符合条件用本地 不符合条件用集群
与直接设置HADOOP参数语句的不同
一个自动,一个主动。

set mapreduce.framework.name=local;
http://www.yayakq.cn/news/852904/

相关文章:

  • 成都网站建设上云快速域名网站备案
  • 我的家乡网站建设模板福田网站建设制作
  • 学校网页网站模板免费下载查询域名是否做过网站
  • 佛山公众平台网站推广多少钱网页翻译算切屏吗
  • 在凡科网申请的网站设置网页访问密码模板做网站多少钱
  • 肃宁做网站价格网站图片设置软件
  • 资源网站自己建设还是发软文保山网站建设报价
  • 网站建设贰金手指科捷6杭州鼎易科技做网站太坑
  • 网站建设费算不算固定资产整站seo包年费用
  • 女人能做网站开发吗杭州手机网站建设
  • 支付的网站建设费整么做账网站开发要学什么
  • 西安h5网站建设前端开发培训机构成都
  • 网上做调查网站wordpress dopt
  • 做商城购物网站厦门建设网站
  • 四川城乡与住房建设部网站专业建站流程
  • 铁道部售票网站多少钱建设网站建设与服务费是什么服务
  • 西安网站建设电话微信小程序网站模板
  • 检察院网站建设情况网站建设 维护费用
  • 建设自己的网站怎么做网站建设安全吗
  • 网站建设越来越便宜网页休闲小游戏
  • wordpress tags页面旺道seo优化软件
  • 论坛式网站建设最新大气房地产企业网站织梦模板
  • 网站建设营销外包公司排名中国建设银行官网个人网上银行
  • 企业网站如何去做优化网站项目计划书
  • 蛋糕方案网站建设建筑网片的用途
  • 烟台市城市建设发展有限公司网站店面设计师
  • 萌宝宝投票网站怎么做外贸公司推广平台
  • 淡水做网站做ppt用什么网站
  • 样asp.net做网站和县建设局网站
  • seo网站推广实例北京营销推广网站建设