当前位置: 首页 > news >正文

个人网页网站制作模板域名是什么举个例子

个人网页网站制作模板,域名是什么举个例子,可以充值的网站怎么建设,Wordpress安装购物车目录前言优化策略推荐使用group by代替distinct去重前言 优化策略 推荐使用group by代替distinct去重 参考: hive中groupby和distinct区别以及性能比较 - cnblogs数据倾斜之count(distinct) - cnblogs 重要结论: 两者都会在map阶段count&#xff0c…

目录

  • 前言
  • 优化策略
    • 推荐使用group by代替distinct去重

前言

优化策略

推荐使用group by代替distinct去重

参考:

  • hive中groupby和distinct区别以及性能比较 - cnblogs
  • 数据倾斜之count(distinct) - cnblogs

重要结论: 两者都会在map阶段count,但reduce阶段,distinct只有一个, group by 可以有多个进行并行聚合,所以group by会快。

distinct 只生成一个reducer任务,所有的id都聚集到同一个reducer任务进行去重然后在聚合,非常容易造成数据倾斜。distinct耗费内存,可能产生OOM,但效率高。
group by 将数据分组到了多个reducer上进行处理,所以较快。groupby排序消耗时间更多,在时间复杂度允许下,空间复杂度更低。

例子:
在一个具有5,563,985,064个记录的hive表中,对其中的两个字段进行查询,耗时如下:

-- 耗时00:11:17
select col1,col2
from 库名xxx.表名xxx
where ds=20230224
group by col1,col2;-- 耗时00:25:07
select distinct col1,col2
from 库名xxx.表名xxx where ds=20230224;

【其他优化策略待更新】

http://www.yayakq.cn/news/134357/

相关文章:

  • 建设内网网站流程高端的科技网站建设
  • 外贸网站推广制作教程郑州网站开发与建设
  • 门户网站属于什么类型的模式python 网站开发实例教程
  • 网站优化推广多少钱程序员网站需要多少钱
  • 广州市网站搭建制作外贸公司是什么类型的企业
  • 东莞市建设网站首页官网网页设计实训报告总结1000字免费
  • 提供微网站建设免费网上咨询医生是哪个网
  • 自己可以做英文网站么鲜花店的网站建设
  • 学而思最早是做网站的吗房地产网站系统
  • 网站建设方案说明书中国纪检监察报单国平
  • 公司网站建设注意事项云主机搭建多个网站
  • 网站内页可以做关键词优化吗网站建设 软件开发的公司哪家好
  • 网站的空间怎么查开发公司哪个部门工作好
  • 陕西网站开发公司电话设计了网站
  • 国外的平面设计网站wordpress空白主题
  • 健身房网站建设怎样提高网站浏览量
  • 阳西县建设局网站推荐 网站空间
  • 做国外网站什么定位中国黄金建设网站
  • 全民建网站wordpress 突然404
  • 陕西西安网站建设公司哪家好百度一下百度官网
  • 深圳快速网站制作哪家快网络推广合作协议范本
  • 做淘宝店招的网站来宾网站制作公司
  • 济南做网站优化哪家好买权重网站
  • 网站关键词优化排名软件系统农业网站模板
  • 石家庄营销型网站建设费用赣州新闻联播视频
  • 怎么开个网站国内做网站的龙头企业
  • aspcms 网站地图徐州高端模板建站
  • 现在公司网站重要吗水果销售网站模板
  • 常熟建设合同备案在哪个网站七牛云收费标准
  • 广州网站开发公司有哪些河南省百城建设提质工程网站