当前位置: 首页 > news >正文

广东电子商务网站建设价格北京市场调研公司

广东电子商务网站建设价格,北京市场调研公司,海外营销推广,广州抖音推广公司分析&回答 1、flink数据倾斜的表现: 任务节点频繁出现反压,增加并行度也不能解决问题 部分节点出现OOM异常,是因为大量的数据集中在某个节点上,导致该节点内存被爆,任务失败重启 2、数据倾斜产生的原因&#x…

分析&回答

1、flink数据倾斜的表现:

任务节点频繁出现反压,增加并行度也不能解决问题

部分节点出现OOM异常,是因为大量的数据集中在某个节点上,导致该节点内存被爆,任务失败重启

2、数据倾斜产生的原因:

业务上有严重的数据热点,比如滴滴打车的订单数据中北京、上海等几个城市的订单量远远超过其他地区;

技术上大量使用了 KeyBy、GroupBy 等操作,错误的使用了分组 Key,人为产生数据热点。

3、解决问题的思路:

业务上要尽量避免热点 key 的设计,例如我们可以把北京、上海等热点城市分成不同的区域,并进行单独处理;

技术上出现热点时,要调整方案打散原来的 key,避免直接聚合;此外 Flink 还提供了大量的功能可以避免数据倾斜。

3、Flink 任务数据倾斜场景和解决方案

A、两阶段聚合解决 KeyBy 热点:

  • 首先把分组的 key 打散,比如加随机后缀;
  • 对打散后的数据进行聚合;
  • 把打散的 key 还原为真正的 key;
  • 二次 KeyBy 进行结果统计,然后输出。
DataStream sourceStream = ...;
resultStream = sourceStream.map(record -> {Record record = JSON.parseObject(record, Record.class);String type = record.getType();record.setType(type + "#" + new Random().nextInt(100));return record;}).keyBy(0).window(TumblingEventTimeWindows.of(Time.minutes(1))).aggregate(new CountAggregate()).map(count -> {String key = count.getKey.substring(0, count.getKey.indexOf("#"));return RecordCount(key,count.getCount);})//二次聚合.keyBy(0).process(new CountProcessFunction);
resultStream.sink()...env.execute()...
复制代码

B、GroupBy + Aggregation 分组聚合热点问题:

将SQL 拆成了内外两层,第一层通过随机打散 100 份的方式减少数据热点,当然这个打散的方式可以根据业务灵活指定。

select date,type,sum(pv) as pv
from(selectdate,type,sum(count) as pvfrom tablegroup bydate,type,floor(rand()*100) --随机打散成100份 )group by date,type;
复制代码

C、Flink 消费 Kafka 上下游并行度不一致导致的数据倾斜

Flink 消费 Kafka 的数据时,是推荐上下游并行度保持一致,即 Kafka 的分区数等于 Flink Consumer 的并行度

但是会有一种情况,为了加快数据的处理速度,来设置 Flink 消费者的并行度大于 Kafka 的分区数。如果你不做任何的设置则会导致部分 Flink Consumer 线程永远消费不到数据。需要设置 Flink 的 Redistributing,也就是数据重分配

dataStream.setParallelism(2)// 采用REBALANCE分区策略重分区.rebalance() //.rescale().print().setParallelism(4);
复制代码
  • Rebalance 分区策略,数据会以 round-robin 的方式对数据进行再次分区,可以全局负载均衡。
  • Rescale 分区策略基于上下游的并行度,会将数据以循环的方式输出到下游的每个实例中

喵呜面试助手:一站式解决面试问题,你可以搜索微信小程序 [喵呜面试助手] 或关注 [喵呜刷题] -> 面试助手 免费刷题。如有好的面试知识或技巧期待您的共享!

http://www.yayakq.cn/news/50739/

相关文章:

  • 网站上上传图片 怎么做电商可以从事的行业有哪些
  • 东莞中小企业网站制作企业形象设计成功案例
  • 龙岩做网站开发价格网站建设款分录
  • 公司的网站的设计高校网站建设存在问题
  • ac86u做网站服务器西安网站的设计说明
  • 公司网址怎么注册步骤花生壳内网穿透网站如何做seo优化
  • 长沙市门户网站建设iis7网站建设
  • 网站开发是什么专业百度北京网页设计软件培训学校
  • 杭州开发网站的公司客户网站开发全流程
  • 网站设计知名企业WordPress集成插件到主题
  • 企业网站定制开发流程松岗网站建设
  • 珠海市做网站公司互联网行业市场分析
  • 网站编辑没有经验可以做吗公众号做电影网站赚钱
  • wordpress社交类主题天津网站的优化
  • 百度灰色词优化排名广州seo教程
  • 宁波网站设计企业南宁市兴宁建设局网站
  • 百度智能云网站建设wordpress生成默认密码
  • 设计企业网站首页成都计算机培训机构哪个最好
  • h5响应式网站建设非盈利网站建设问题
  • 济宁市任城区建设局网站河南seo公司
  • 南京有制作网站的吗邯郸房地产网站建设
  • 网站设计公司合肥网站建设主流编程软件
  • 沈阳微营销网站制作昆明软件开发公司
  • 用护卫神做网站两学一做纪实评价系统登陆网站
  • 建设企业网站需要了解什么wordpress会员登录界面美化
  • 佛山市城乡和住房建设局网站网站开发 在线数据库
  • 动态手机网站北京建设网站制作
  • 公司网站制作教学北京网站搭建公司排行
  • 乡镇网站建设自查报告陕西网络营销优化公司
  • 网站建设 提升和扩大企业邮箱注册申请需要付费吗