当前位置: 首页 > news >正文

河北省建设机械协会是正规网站吗如何做起一个网站推广

河北省建设机械协会是正规网站吗,如何做起一个网站推广,拼多多申请注册店铺,wordpress 关闭更新警告(一)宽依赖和窄依赖 窄依赖(Narrow Dependency):指父RDD的每个分区只被子RDD的一个分区所使用,例如map、filter等 这些算子一个RDD,对它的父RDD只有简单的一对一的关系,也就是说,RDD的每个part…

(一)宽依赖和窄依赖

  1. 窄依赖(Narrow Dependency):指父RDD的每个分区只被子RDD的一个分区所使用,例如map、filter等
    这些算子一个RDD,对它的父RDD只有简单的一对一的关系,也就是说,RDD的每个partition仅仅依赖于父RDD
    中的一个partition,父RDD和子RDD的partition之间的对应关系,是一对一的。
  2. 宽依赖(Shuffle Dependency):父RDD的每个分区都可能被子RDD的多个分区使用,例如groupByKey、
    reduceByKey,sortBykey等算子,这些算子其实都会产生shuffle操作。也就是说,每一个父RDD的partition中的数据都可能会传输一部分到下一个RDD的每个partition中。此时就会出现,父RDD和子RDD的partition之间,具有错综复杂的关系,那么,这种情况就叫做两个RDD之间是宽依赖,同时,他们之间会发生shuffle操作。
    在这里插入图片描述
    最左侧是linesRDD,这个表示我们通过textFile读取文件中的数据之后获取的RDD,接着是我们使用flatMap算子,对每一行数据按照空格切开,然后可以获取到第二个RDD,这个RDD中包含的是切开的每一个单词

在这里这两个RDD就属于一个窄赖,因为父RDD的每个分区只被子RDD的一个分区所使用,也就是说,他们的分区是一对一的,这样就不需要经过shuffle了。

接着是使用map算子,将每一个单词转换成(单词,1)这种形式,此时这两个RDD也是一个窄依赖的关系,父RDD的分区和子RDD的分区也是一对一的。最后我们会调用reduceByKey算子,此时会对相同key的数据进行分组,分到一个分区里面,并且进行聚合操作,此时父RDD的每个分区都可能被子RDD的多个分区使用,那这两个RDD就属于宽依赖了。

(二)Stage

spark job是根据action算子触发的,遇到action算子就会起一个job

注意

  1. stage的划分依据就是看是否产生了shuflle(即宽依赖),遇到一个shuffle操作就划分为前后两个stage。
  2. stage是由一组并行的task组成,stage会将一批task用TaskSet来封装,提交给TaskScheduler进行分配,最后发送到Executor执行。
    在这里插入图片描述
    注意:Stage的划分规则:从后往前,遇到宽依赖就划分Stage

(三)Spark Job的三种提交方式

  1. 第一种,standalone模式,基于Spark自己的standalone集群。
    指定–master spark://bigdata01:7077
  2. 第二种,是基于YARN的client模式。
    指定–master yarn --deploy-mode client
    这种方式主要用于测试,查看日志方便一些,部分日志会直接打印到控制台上面,因为driver进程运行在本地客户端,就是提交Spark任务的那个客户端机器,driver负责调度job,会与yarn集群产生大量的通信,一般情况下Spark客户端机器和Hadoop集群的机器是无法内网通信,只能通过外网,这样在大量通信的情况下会影响通信效率,并且当我们执行一些action操作的时候数据也会返回给driver端,driver端机器的配置一般都不高,可能会导致内存溢出等问题。
  3. 第三种,是基于YARN的cluster模式。【推荐】
    指定–master yarn --deploy-mode cluster
    这种方式driver进程运行在集群中的某一台机器上,这样集群内部节点之间通信是可以通过内网通信的,并且集群内的机器的配置也会比普通的客户端机器配置高,所以就不存在yarn-client模式的一些问题了,只不过这个时候查看日志只能到集群上面看了,这倒没什么影响。
    在这里插入图片描述
http://www.yayakq.cn/news/638202/

相关文章:

  • 网站空间购买时选择什么脚本语言个人网页的内容模板设计
  • 网站建设制作过程企业网站建设费记什么科目
  • 网站设计一般多长时间深圳昨天下午出大事
  • vps做网站需要做哪些准备中国建设银行数据管理部网站
  • 怎样优化网站排名昆山网站建设需要多少钱
  • 网站备案用的方案建设wordpress 微信 微博
  • 广告公司网站建设网站备案进度
  • 系统 网站开发工程师网站后台口令
  • 招聘设计师去哪个网站医药cms是什么意思
  • 石家庄市市政建设工程公司网站wordpress转app
  • 网站备案号中信息有变合肥网站设计网址
  • 私人制定网站1688网页版登录入口
  • 建设美食电子商务网站徐州市城乡和城乡建设厅网站首页
  • 视频网站建设框架战略网页游戏开服表
  • 福州网站建设加推广携程网站模板
  • 百度站长工具怎么查排名专业做二手网站有哪些
  • 外链建设应如何进行seo技术蜘蛛屯
  • 什么是做学院网站网站排名查询
  • 北京做网站比较好的谷德设计网app
  • 做网站的具体需求中国中小企业河南网
  • 漳州哪里做网站wordpress json api auth
  • 企业营销型网站建设价格中国服务外包
  • 中国企业报集团简介百度seo优化
  • 无锡 网站建设专业的建站公司服务
  • 东莞seo网站建设公司怎样在凡科免费做网站
  • 湖州佳成建设网站中讯科技-运城网站建设
  • 辽宁城建设计院有限公司网站微信网站 详解
  • 网站改版会影响收录吗济南建网站价格消费品展
  • 马边彝族移动网站建设海口建设网站
  • 辽阳专业网站开发公司财务公司协会