当前位置: 首页 > news >正文

推广网站代码佛山整合营销

推广网站代码,佛山整合营销,怎么样做销往非洲太阳能板的网站,wordpress微博登陆spark的代码分为两种 本地代码在driver端直接解析执行没有后续 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算 spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G sc.textFile("/home/ha…

spark的代码分为两种

  • 本地代码在driver端直接解析执行没有后续

  • 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算

spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G
sc.textFile("/home/hadoop/a.txt")
org.apache.spark.rdd.RDD[String] = /home/hadoop/a.txt MapPartitionsRDD[1] at textFile at

rdd弹性分布式数据集合

  • 如果是sc调用的方法会在集群中执行
  • rdd调用的方法也会集群执行
sc.textFile("/home/hadoop/a.txt")

不是单机代码,但是文件不能再某一个机器上,因为这个命令所有的机器都会执行。

这个路径一定要放在hdfs中

问题:第一行代码就读取了数据,为什么第一行没有出现错误?

spark中的方法[算子]它是分为两种

  • 转换类算子,定义逻辑,并且调用完毕以后具有返回值的,调用算子以后是不是返回rdd
  • 行动类算子,触发计算,并且没有rdd的返回

代码的整体逻辑是先使用转换类算子定义逻辑,但是不执行,一旦使用action算子就会触发运算,整体才执行,这样的设计能够最大化的减少内存的使用。

所以上传hdfs文件,读取

hdfs dfs -put /home/hadoop/a.txt /

spark-shell整体代码

scala> //在spark-env.sh中配置HADOOP_CONF_DIR,默认会读取hdfs中的文件scala> sc.textFile("/a.txt")
res6: org.apache.spark.rdd.RDD[String] = /a.txt MapPartitionsRDD[5] at textFile at <console>:26
//放入数据到hdfs中
scala> res6.flatMap(_.split(" "))
res7: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[6] at flatMap at <console>:27scala> res7.map((_,1))
res8: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[7] at map at <console>:27scala> res8.groupBy(_._1)
res9: org.apache.spark.rdd.RDD[(String, Iterable[(String, Int)])] = ShuffledRDD[9] at groupBy at <console>:27
//分组完毕的返回值不再是map而是RDD[String,Iterable]
scala> res9.mapValues(_.size)
res10: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[10] at mapValues at <console>:27
//mapValues在scala中只能作用在map集合上,现在可以作用在RDD[k,v]
scala> res10.foreach(println)
//打印数据的时候每个机器都有,因为是分布式执行的

http://www.yayakq.cn/news/491895/

相关文章:

  • 网站开始开发阶段的主要任务微信小程序投票怎么快速投多票
  • 推荐网站网页如何在百度举报网站
  • 招聘类网站怎么做深圳企业建站程序
  • 怎么做仿制网站电脑做系统ppt下载网站
  • 推广app赚钱项目做seo网站图片怎么优化
  • 孟津网站开发个人免费建站系统
  • 做图软件ps下载网站产品发布网站
  • 教育机构网站制作模板深圳网站建设599元全包
  • 漂亮的手机网站模板炒股软件下载
  • 网站推广昔年下拉asp.net网站开发简介
  • 十大中文网站排名wordpress关闭分享
  • 如果做国外网站导购wordpress2019主题
  • wordpress 子站点函数服务公司名称大全
  • 深圳龙岗网站建设公司网站开发定位
  • 郑州网站设计汉狮住建部网站村镇建设管理平台
  • 网站架构设计师主要做什么有哪些好的响应式网站
  • 网站页面设计优化方案拼多多网店注册
  • 网站代码优化目的网站开发主要学些什么软件
  • 济源做网站公司php网站的部署
  • .net 开源 企业网站网站内容相同算侵权吗
  • 网站备案不通过seo主要做什么工作
  • 宁波环保营销型网站建设深圳集团网站开发网站开发公司电话
  • 北京智能网站建设系统加盟山东省住房与建设厅网站
  • 怎么免费创建个人网站南昌有做网站的吗
  • 学校户网站建设方案建设行政主管部门官方网站
  • 本地做织梦网站wordpress头像管理插件
  • 上海整形网站建设网站建设找谁
  • 网站宣传搭建品牌企业网站建设公司
  • 做网站熊掌号代理公司和经纪公司的区别
  • 打开网址资料网站智慧团建系统手机端