当前位置: 首页 > news >正文

家电网站制作劳务公司网站建设

家电网站制作,劳务公司网站建设,网站界面 欣赏,江门网站制作费用17张图带你彻底理解Hudi Upsert原理 1.开始提交:判断上次任务是否失败,如果失败会触发回滚操作。然后会根据当前时间生成一个事务开始的请求标识元数据。2.构造HoodieRecord Rdd对象:Hudi 会根据元数据信息构造HoodieRecord Rdd 对象&#xf…

17张图带你彻底理解Hudi Upsert原理

在这里插入图片描述
1.开始提交:判断上次任务是否失败,如果失败会触发回滚操作。然后会根据当前时间生成一个事务开始的请求标识元数据。2.构造HoodieRecord Rdd对象:Hudi 会根据元数据信息构造HoodieRecord Rdd 对象,方便后续数据去重和数据合并。3.数据去重:一批增量数据中可能会有重复的数据,Hudi会根据主键对数据进行去重避免重复数据写入Hudi 表。4.数据fileId位置信息获取:在修改记录中可以根据索引获取当前记录所属文件的fileid,在数据合并时需要知道数据update操作向那个fileId文件写入新的快照文件。5.数据合并:Hudi 有两种模式cow和mor。在cow模式中会重写索引命中的fileId快照文件;在mor 模式中根据fileId 追加到分区中的log 文件。6.完成提交:在元数据中生成xxxx.commit文件,只有生成commit 元数据文件,查询引擎才能根据元数据查询到刚刚upsert 后的数据。7.compaction压缩:主要是mor 模式中才会有,他会将mor模式中的xxx.log 数据合并到xxx.parquet 快照文件中去。8.hive元数据同步:hive 的元素数据同步这个步骤需要配置非必需操作,主要是对于hive 和presto 等查询引擎,需要依赖hive 元数据才能进行查询,所以hive元数据同步就是构造外表提供查询。

2.5.1 Copy on Write模式
COW模式数据合并实现逻辑调用BaseSparkCommitActionExecutor#excute方法,实现步骤如下:

在这里插入图片描述

http://www.yayakq.cn/news/875028/

相关文章:

  • 秦皇岛手机网站制作多少钱网站ui设计收费
  • 四川省建设厅网站为什么打不开网易免费邮箱注册
  • 中国建设工程协会网站安装wordpress报错
  • 沧州网站备案网站优化排名技巧
  • 自适应影视网站模板wordpress如何添加广告代码
  • 下沙网站制作wordpress音乐播放显示歌词
  • 嘉兴简单建站分销系统搭建
  • 做ppt做好的网站烟台做网站谁家好
  • 怎么在网上做装修网站企业官网网页
  • 长沙网站推广系统wordpress 文章数量
  • 利用ionic做的网站网站seo推广的方法
  • 装饰工程有限公司起名大全wordpress速度优化简书
  • 哪些网站可以用gif做头像wordpress mx主题VIP
  • 商洛 网站建设wordpress3.5.1zhcn
  • 网站优化需要工具网页设计与制作怎么把图片加进去
  • 织梦cms做视频网站wordpress站群+优化
  • 微信卖货小程序seo标题关键词怎么写
  • 硬件开发一站式平台阜新市网站建设
  • 网站的建设服务平台wordpress 投资
  • php做的网站好不好国内营销策划咨询公司
  • 国外网站国内做二维码网站名称怎么起好听
  • 贵港做网站建设价格费用什么是网站易用性
  • 威海网站建设whhl网站建设微信官网开发
  • 丽水网站seo在线做免费网站有哪些
  • 雷州网站建设qq免费的推广引流软件
  • 创新的购物网站建设vultr安装wordpress
  • 安徽元鼎建设公司网站wordpress主题 站长
  • 电商网站分析开关网站建设
  • 创建一个网站多少钱wordpress最新文章id
  • 网站建设自查工作助农网站策划书