当前位置: 首页 > news >正文

太仓手机网站建设价格规范机关单位网站建设

太仓手机网站建设价格,规范机关单位网站建设,网站怎么提供下载,店铺首页如何设计前言 研究总结 Hudi extraMetadata ,记录研究过程。主要目的是通过 extraMetadata 保存 source 表的 commitTime (checkpoint), 来实现增量读Hudi表写Hudi表时,保存增量读状态的事务性,实现类似于流任务中的 exactly-once 背景需求 有个需求:增量读Hudi表关联其他Hudi…

前言

研究总结 Hudi extraMetadata ,记录研究过程。主要目的是通过 extraMetadata 保存 source 表的 commitTime (checkpoint), 来实现增量读Hudi表写Hudi表时,保存增量读状态的事务性,实现类似于流任务中的 exactly-once

背景需求

有个需求:增量读Hudi表关联其他Hudi表然后做一些复杂的业务处理逻辑,然后将结果表保存到目标Hudi表中

然后就有问题:如何保证保存目标Hudi表和保存 endCommiTime 是事务的。具体如下
1、Spark支持增量读Hudi表,需要传入起(始) commitTime。
2、上一批数据处理完成后应该保存上次增量读的的 endCommiTime,作为下一批增量读的的 beginCommitTime
3、可以选择将上一批的 endCommiTime 保存到 HDFS 或者数据库表中,但是不能保证事务。(并且还需要借助外部表或者存储目录,如果能通过Hudi本身解决,就比较完美了)
4、也就是可能存在保存目标Hudi表成功,但是保存 endCommiTime 失败的情况

这时就想到了 DeltaStreamer 中是通过设置 checkpoint 来实现的,具体是通过将 commitTime 的值保存到目标表 .commit 元数据文件中(extraMetadata->deltastreamer.checkpoi

http://www.yayakq.cn/news/136498/

相关文章:

  • 免费网站制作多少钱微信网站制作设计方案
  • 淘宝买cdk自己做网站wordpress页面访问量
  • 设计一个网站要多少钱营销型网站建设php源码
  • 政务网站建设上海的软件公司排名
  • 网站建设进度表模板wordpress局域网内访问
  • 湖北手机版建站系统哪家好视觉设计师工资一般多少
  • 网站建设规划书摘要500字wordpress做微信登录页
  • 可以给别人做ps设计的网站万维网网站注册
  • 上海网站哪家好南通专业网站制作
  • 上海专业的网站杭州网站seo推广软件
  • 做网站和做程序一样吗php网站如何攻击
  • 做业务员找数据的网站保定网站设计制作公司
  • 哪个网站做演唱会门票wordpress响应式主板
  • 手机网站背景图尺寸做网站的原型 免费
  • 网站开发具体步骤有什么做礼品的卖家网站
  • 解除网站被拦截的方法网站建设-易速通科技
  • 建设网站框架佛山网站设计建设
  • 网站的版式设计有哪些提供网站建设
  • 甘肃再就业建设集团网站网站怎么做推广知乎
  • asp网站助手成都网站开发培训机构
  • 如何做微信朋友圈网站如何开网店不用自己发货
  • 怎么做淘宝客的跳转网站网站首页弹出图片
  • 机械制造设备类企业网站织梦模板单位网站建设工作功劳
  • html网站地图制作西安seo代理商
  • 建立网站的成本wordpress 朋友圈插件
  • 网站建设与网页设计pptwordpress 后台打开慢
  • php做网站用什么软件好装修培训机构哪家最好
  • 泗洪有做网站百度推广获客成本大概多少
  • 医疗网站设计网站淄博seo
  • 做游戏人设计网站焦溪翠冠梨做的网站