当前位置: 首页 > news >正文

梅州建网站wordpress 文章阅读量

梅州建网站,wordpress 文章阅读量,公司门户网站什么意思,火狐如何去掉2345网址导航宽依赖窄依赖的区别 窄依赖:RDD 之间分区是一一对应的宽依赖:发生shuffle,多对多的关系 宽依赖是子RDD的一个分区依赖了父RDD的多个分区父RDD的一个分区的数据,分别流入到子RDD的不同分区特例:cartesian算子对应的Car…

宽依赖窄依赖的区别

  • 窄依赖:RDD 之间分区是一一对应的
  • 宽依赖:发生shuffle,多对多的关系
    • 宽依赖是子RDD的一个分区依赖了父RDD的多个分区
    • 父RDD的一个分区的数据,分别流入到子RDD的不同分区
    • 特例:cartesian算子对应的CartesianRDD,是通过创建了两个 NarrowDependency 完成了笛卡尔乘积操作,属于窄依赖。

窄依赖

搜索源码,RangeDependency只有UnionRDD使用到了

val rdd1 = sc.parallelize(List(("a",1),("b",2)))
rdd1.partitions.size
//val res4: Int = 2
val rdd2 = sc.parallelize(List(("c",3),("d",4),("a",1)))
rdd2.partitions.size
//val res5: Int = 2
val rdd3 = rdd1.union(rdd2)
//val rdd3: org.apache.spark.rdd.RDD[(String, Int)] = UnionRDD[3] at union at <console>:1
rdd3.partitions.size
//val res7: Int = 4
rdd3.foreach(print)
//输出结果为:(a,1)(b,2)(c,3)(d,4)(a,1)

宽依赖

情况一

举例:cogroup算子、join算子

功能:将两个RDD中键值对的形式元素,按照相同的key,连接而成,只是将两个在类型为(K,V)和(K,W)的 RDD ,返回一个(K,(Iterable<V>,Iterable<W>))类型的 RDD

//cogroup	
val rdd1 = sc.parallelize(List(("a",1),("b",2)))
rdd1.partitions.size
//val res4: Int = 2
val rdd2 = sc.parallelize(List(("c",3),("d",4),("a",1)))
rdd2.partitions.size
//val res5: Int = 2
val newRDD = rdd1.cogroup(rdd2)
//val newRDD: org.apache.spark.rdd.RDD[(String, (Iterable[Int], Iterable[Int]))] = MapPartitionsRDD[8] at cogroup at <console>:1
newRDD.foreach(println)
//(a,(Seq(1),Seq(1)))
//(c,(Seq(),Seq(3)))
//(d,(Seq(),Seq(4)))
//(b,(Seq(2),Seq()))//join
val join = rdd1.join(rdd2)
//val join: org.apache.spark.rdd.RDD[(String, (Int, Int))] = MapPartitionsRDD[11] at join at <console>:1
join.foreach(println)
//(a,(1,1))

情况二

举例:groupByKey算子、reduceByKey算子

//groupByKey
val rdd = sc.parallelize(List(("a",1),("b",2),("a",1),("b",2)))
val groupRdd = rdd1.groupByKey()
//val groupRdd: org.apache.spark.rdd.RDD[(String, Iterable[Int])] = ShuffledRDD[16] at groupByKey at <console>:1
groupRdd.foreach(println)
//(b,Seq(2, 2))
//(a,Seq(1, 1))//reduceByKey
val reduceRdd = rdd.reduceByKey(_+_)
//val reduceRdd: org.apache.spark.rdd.RDD[(String, Int)] = ShuffledRDD[18] at reduceByKey at <console>:1
reduceRdd.foreach(println)
//(a,2)
//(b,4)

特例:cartesian算子

val rdd1 = sc.parallelize(List(("a",1),("b",2)))
rdd1.partitions.size
//val res4: Int = 2
val rdd2 = sc.parallelize(List(("c",3),("d",4),("a",1)))
rdd2.partitions.size
//val res5: Int = 2
val cartesianRdd = rdd1.cartesian(rdd2)
//val cartesianRdd: org.apache.spark.rdd.RDD[((String, Int), (String, Int))] = CartesianRDD[20] at cartesian at <console>:1
cartesianRdd.partitions.size
//val res24: Int = 4
cartesianRdd.foreach(println)
//((a,1),(c,3))
//((b,2),(c,3))
//((a,1),(d,4))
//((a,1),(a,1))
//((b,2),(d,4))
//((b,2),(a,1))

http://www.yayakq.cn/news/642974/

相关文章:

  • 电脑做系统教学网站网站推广 知乎
  • ftp网站 免费网站备案通知
  • 三合一网站和传统网站网站代码编辑器
  • 浙江省建设厅网站如何查安全员网站备案核验系统
  • 网页设计国外设计欣赏网站企业融资方案范本
  • 泉州市建设局网站apache 指向wordpress
  • 东莞网站设计哪家强wordpress文章字体颜色
  • 青海网站建设湖北省建设交易协会网站
  • 质感设计网站企业网站源码哪个最好
  • 怎么看一个网站是由哪个网络公司做的电商设计网站素材
  • 网站开发与管理心得体会科技公司网站欣赏
  • 没有做老千的斗牛网站6电子商务这个专业好吗
  • 深圳学校网站建设lnmp wordpress php7
  • 设置网站文件夹的安全项广州企业网站模板购买
  • 网站最下面版权模板网站刷收益是怎么做的
  • 临沂手机网站建设网站建设课程职业教育机构
  • 汕头seo网站优化网页设计介绍北京网站
  • 东莞网站建设dgjwz有项目没有钱怎么找投资人
  • 怎样做网站表白小程序搭建多少钱
  • 做seo用哪种建站程序最好网站的ftp怎么查
  • dede我的网站如何使用seo进行综合查询
  • 昆山网站建设多少钱php网站开发自学
  • 网站建设公司兴田德润优惠微信的网站怎么做
  • 腾讯云建站流程wordpress加链接地址
  • 深圳微信网站运营seo是什么地方
  • 网站降权怎么救wordpress标签小工具栏
  • 做旅游攻略比较好的网站php调用wordpress函数
  • WordPress创建页面左侧导航网络优化的目的
  • 网站设计的能力要求wrix 网站开发
  • 商城网站wordpress学院网站建设项目范围变更申请表