当前位置: 首页 > news >正文

坪山网站建设策划网站的定位分析

坪山网站建设策划,网站的定位分析,网络服务器与网站建设,网站做推广需要什么锁屏面试题百日百刷,每个工作日坚持更新面试题。锁屏面试题app、小程序现已上线,官网地址:https://www.demosoftware.cn。已收录了每日更新的面试题的所有内容,还包含特色的解锁屏幕复习面试题、每日编程题目邮件推送等功能。让你…

  锁屏面试题百日百刷,每个工作日坚持更新面试题。锁屏面试题app、小程序现已上线,官网地址:https://www.demosoftware.cn。已收录了每日更新的面试题的所有内容,还包含特色的解锁屏幕复习面试题、每日编程题目邮件推送等功能。让你在面试中先人一步!接下来的是今日的面试题:

 

1.如何理解SMB Join

全称Sort Merge Bucket Join。

作用

大表对小表应该使用MapJoin来进行优化,但是如果是大表对大表,如果进行shuffle,那就非常可怕,第一个慢不用说,第二个容易出异常,此时就可以使用SMB Join来提高性能。SMB Join

基于bucket-mapjoin的有序bucket,可实现在map端完成join操作,可以有效地减少或避免shuffle的数据量。SMB join的条件和Map join类似但又不同。

条件

注意事项

hive并不检查两个join的表是否已经做好bucket且sorted,需要用户自己去保证join的表数据sorted,否则可能数据不正确。

有两个办法:

1)hive.enforce.sorting 设置为 true。开启强制排序时,插数据到表中会进行强制排序,默认false。

2)插入数据时通过在sql中用distributed c1 sort by c1 或者 cluster by c1

另外,表创建时必须是CLUSTERED且SORTED,如下:

create table test_smb_2(mid string,age_id string)

CLUSTERED BY(mid) SORTED BY(mid) INTO 500 BUCKETS;

综上,涉及到分桶表操作的齐全配置为:

--写入数据强制分桶

set hive.enforce.bucketing=true; --写入数据强制排序

set hive.enforce.sorting=true; --开启bucketmapjoin

set hive.optimize.bucketmapjoin = true; --开启SMB Join

set hive.auto.convert.sortmerge.join=true;

set hive.auto.convert.sortmerge.join.noconditionaltask=true;

开启MapJoin的配置

(hive.auto.convert.join和hive.auto.convert.join.noconditionaltask.size),

还有限制对桶表进行load操作(hive.strict.checks.bucketing)可以直接设置在hive的配置项中,无需在sql中声明。

自动尝试SMB联接(hive.optimize.bucketmapjoin.sortedmerge)也可以在设置中进行提前配置。

2.讲一讲Hive索引

Hive支持索引,但是Hive的索引与关系型数据库中的索引并不相同,比如,Hive不支持主键或者外键。

Hive索引可以建立在表中的某些列上,以提升一些操作的效率,例如减少MapReduce任务中需要读取的数据块的数量。

在可以预见到分区数据非常庞大的情况下,分桶和索引常常是优于分区的。而分桶由于SMB

Join对关联键要求严格,所以并不是总能生效。

Hive的索引目的是提高Hive表指定列的查询速度。

没有索引时,类似'WHERE tab1.col1 = 10' 的查询,Hive会加载整张表或分区,然后处理所有的rows,但是如果在字段col1上面存在索引时,那么只会加载和处理文件的一部分。

在每次建立、更新数据后,Hive索引不会自动更新,需要手动进行更新(重建索引以构建索引表),会触发一个mr job。

Hive索引使用过程繁杂,而且性能一般,在Hive3.0中已被删除,在工作环境中不推荐优先使用,在分区数量过多或查询字段不是分区字段时,索引可以作为补充方案同时使用。推荐使用ORC文件格式的索引类型进行查询。

http://www.yayakq.cn/news/297956/

相关文章:

  • asp.net小型网站开发做一个简单网站
  • 许昌市网站建设找汉狮网站跳转怎么解释
  • 公司网站怎么做才能吸引人做网站一年赚多少钱
  • 中铁集团2021招聘信息宁阳县网络seo
  • 百度验证网站的好处一般做网站所使用的字体
  • 网站策划编辑如何做wordpress 边框插件
  • 百度推广 个人网站怎么推广网址
  • 电子商务网站建设与策划网站设计的原则有哪些
  • 类模板模板下载网站有哪些阿里云域名注册新人
  • 有什么推荐的网站一键生成logo免费网站
  • 将网页加入可信站点秦皇岛市建设路小学网站
  • 杭州市网站制作甘肃网站建设方案及案例
  • 湖南网站制作做外贸网站市场
  • 外贸网站制作要求公司策划方案
  • 旅游电子商务网站开发方案wordpress只显示纯文字
  • 手把手教建设网站外贸自建网站
  • 如何将网站和域名绑定wordpress模板如何管理
  • 广东省建设厅网站可以查怎么用腾讯云主机建设网站
  • 网站建设费用应按几年摊销网站建设做的人多吗
  • 浙江交工宏途交通建设有限公司网站360建筑网电脑版
  • 有哪些好的做网站公司好泰安网站建设制作电话号码
  • dw网站建设步骤岳麓区网站建设
  • wordpress构建自己的网站做亚马逊有哪些站外折扣网站
  • 什么网站会更有浏览量重庆建站网站企业
  • 怎样做科普视频网站网络系统安全原则
  • 微网站页面网站维护外包合同
  • 珠海手机网站建设费用网站推广的六种方式
  • 金乡网站建设哪家好购物网站开发的背景
  • 做渔家乐哪个网站最好爱空间装修公司口碑怎么样
  • 常州孟河镇建设工程交易网站做网站的职业规划