当前位置: 首页 > news >正文

ios 常用网站土特产网站建设状况

ios 常用网站,土特产网站建设状况,新型建筑模板样品图片,wordpress网站维护MapReduce 的 Shuffle 过程指的是 MapTask 的后半程,以及ReduceTask的前半程,共同组成的。 从 MapTask 中的 map 方法结束,到 ReduceTask 中的 reduce 方法开始,这个中间的部分就是Shuffle。是MapReduce的核心,心脏。 …

MapReduce 的 Shuffle 过程指的是 MapTask 的后半程,以及ReduceTask的前半程,共同组成的。
从 MapTask 中的 map 方法结束,到 ReduceTask 中的 reduce 方法开始,这个中间的部分就是Shuffle。是MapReduce的核心,心脏。

map端:

1、map中的context.write方法,对外写出的时候,其实是写入到了一个环形缓冲区内(内存形式的),这个环形缓冲区大小是100M,可以通过参数设置。如果里面的数据大于80M,就开始溢写(从内存中将数据写入到磁盘上)。溢写的文件存放地址可以设置。


2、在溢写过程中,环形缓冲区不会停止工作,是会利用剩余的20%继续存入环形缓冲区的。除非是环形缓冲区的内存满了,map任务就被阻塞了。
在溢写出来的文件中,是排过序的,排序规则:快速排序算法。在排序之前,会根据分区的算法,对数据进行分区。在内存中,先分区,在每一个分区中再排序,接着溢写到磁盘上的。


3、溢写出来的小文件需要合并为一个大文件,因为每一个MapTask只能有一份数据。就将相同的分区文件合并,并且排序(此处是归并排序)。每次合并的时候是10个小文件合并为一个大文件,进行多次合并,最终每一个分区的文件只能有一份。
假如100个小文件,需要合并几次呢?
100  每10分合并一次,第一轮:100个文件合并为了10个文件,这10个文件又合并为一个大文件,总共合并了11次。

4、将内存中的数据,溢写到磁盘上,还可以指定是否需要压缩,以及压缩的算法是什么。

reduce端: 

1、reduce端根据不同的分区,拉取每个服务器上的相同的分区的数据。
reduce任务有少量复制线程,因此能够并行取得map输出。默认值是5个线程,但这个默认值可以修改,设置mapreduce.reduce.shuffle. parallelcopies 属性即可。


2、如果map上的数据非常的小,该数据会拉取到reduce端的内存中,如果数据量比较大,直接拉取到reduce端的硬盘上。

http://www.yayakq.cn/news/393288/

相关文章:

  • 公司网站制作广东微信网站推广哪家专业
  • 网站开发建设需多少钱wordpress游戏站
  • 网站 ftp信息网站规划教学设计
  • 网站制度建设网站建设杭州公司
  • 自己做网站要买服务器吗wordpress 安装插件慢
  • 企业网站界面 优帮云html制作手机网站
  • 网站建设费 什么科目做同城服务网站比较成功的网站
  • 健身网站开发过程中遇到的麻烦Lms wordpress功能
  • 网站建设用的工具专业做网站 台州玉环
  • 网站开发实习报告谷歌seo服务商
  • 锡林郭勒盟建设工程造价管理网站找工厂货源上什么平台
  • 公司网站属于什么类型中国十大营销专家
  • 企业营销网站建设价格什么编程软件最好
  • 几级英语可以做外贸网站seo网站返回503的含义是
  • 备案网站建设方案书模板wordpress 接入外网慢
  • 可以做基因通路分析的网站wordpress企业网站主题
  • 电子商务就是建网站简历制作app
  • 排行网站模板千图网免费素材
  • 新建网站求友链平台制作网站企业
  • 一个销售网站的设计 应当是要那个网站可以兼职做效果图
  • 做3d ppt模板下载网站有哪些深圳模板网站多少钱
  • 百度企业信用长春seo优化企业网络跃升
  • 电子商务网站建设与管理小论文办公网新闻上传网站开发
  • 淘宝建设网站的上海的做网站的公司
  • 网站怎么做长截图网络办公管理系统
  • 合肥营销网站建设联系方式做网站需要学些什么条件
  • 网站如何改造wapWordPress建站 seo
  • 东莞市房管局官方网站微信小程序安装
  • 网站运营方式网站排名怎么提升
  • 物流管理网站怎么做那个公司可以做网站