当前位置: 首页 > news >正文

网站开发实训报告模板贵阳网站制作维护

网站开发实训报告模板,贵阳网站制作维护,网店美工设计实训步骤,网站建设带采集spark的代码分为两种 本地代码在driver端直接解析执行没有后续 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算 spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G sc.textFile("/home/ha…

spark的代码分为两种

  • 本地代码在driver端直接解析执行没有后续

  • 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算

spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G
sc.textFile("/home/hadoop/a.txt")
org.apache.spark.rdd.RDD[String] = /home/hadoop/a.txt MapPartitionsRDD[1] at textFile at

rdd弹性分布式数据集合

  • 如果是sc调用的方法会在集群中执行
  • rdd调用的方法也会集群执行
sc.textFile("/home/hadoop/a.txt")

不是单机代码,但是文件不能再某一个机器上,因为这个命令所有的机器都会执行。

这个路径一定要放在hdfs中

问题:第一行代码就读取了数据,为什么第一行没有出现错误?

spark中的方法[算子]它是分为两种

  • 转换类算子,定义逻辑,并且调用完毕以后具有返回值的,调用算子以后是不是返回rdd
  • 行动类算子,触发计算,并且没有rdd的返回

代码的整体逻辑是先使用转换类算子定义逻辑,但是不执行,一旦使用action算子就会触发运算,整体才执行,这样的设计能够最大化的减少内存的使用。

所以上传hdfs文件,读取

hdfs dfs -put /home/hadoop/a.txt /

spark-shell整体代码

scala> //在spark-env.sh中配置HADOOP_CONF_DIR,默认会读取hdfs中的文件scala> sc.textFile("/a.txt")
res6: org.apache.spark.rdd.RDD[String] = /a.txt MapPartitionsRDD[5] at textFile at <console>:26
//放入数据到hdfs中
scala> res6.flatMap(_.split(" "))
res7: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[6] at flatMap at <console>:27scala> res7.map((_,1))
res8: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[7] at map at <console>:27scala> res8.groupBy(_._1)
res9: org.apache.spark.rdd.RDD[(String, Iterable[(String, Int)])] = ShuffledRDD[9] at groupBy at <console>:27
//分组完毕的返回值不再是map而是RDD[String,Iterable]
scala> res9.mapValues(_.size)
res10: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[10] at mapValues at <console>:27
//mapValues在scala中只能作用在map集合上,现在可以作用在RDD[k,v]
scala> res10.foreach(println)
//打印数据的时候每个机器都有,因为是分布式执行的

http://www.yayakq.cn/news/626503/

相关文章:

  • dw做网站乱码有什么做美食的视频网站
  • 网站开发 设计文档做跟单员的话应该关注哪些网站
  • 新北区城乡建设局网站建设项目竣工环保验收网站
  • 宁波网站建设设计方案两个网站如何使用一个虚拟主机
  • 衡阳网站排名优化建设银行信用卡网站
  • 郑州网站江苏网站开发多少钱
  • 英文网站seo推广wordpress开启子站
  • aspcms做双语网站修改配置河北邯郸专业网站建设
  • 建设领域现场专业人员报名网站跨境贸易电子商务服务平台
  • 海南网站推广建设网页设计高清素材
  • 萝卜建站app免费网站建设官网
  • 网站月流量是什么意思建设用地规划许可证在哪个网站查询
  • 文件注入网站校园网站建设方案
  • 邯郸怎么做网站wordpress pcdotfan
  • 个人建网站做站长中原区快速建站公司电话
  • 做海外市场什么网站推广wordpress 函数详解
  • 怎么做跟P站一样的网站常德城乡和住房建设局网站
  • 做网站上传信息软件wordpress 格局调整
  • 网站建设中 尽情期待搭建一个影视网站
  • 衡阳网站推广精美网站制作
  • 烟台网站建设价格做销售怎么和客户聊天
  • 马鞍山做网站公司丰浩网站建设中心
  • 平面设计包括哪些方面的设计镇江网站优化seo
  • 做淘宝客一定要网站吗如何制作网页小游戏
  • 苏州网站建设托管南京商城网站开发设计
  • 免费企业建站选哪家立邦漆官方网站官网
  • 机械加工网站推广有效果吗济南网络优化网址
  • 可以帮忙做网站做公司邯郸房产网官网
  • 博罗网站建设费用百度小程序怎么找
  • 做围棋死活题的网站黄页网站推广app免费下载