当前位置: 首页 > news >正文

河南网站备案地址网站开发翻译

河南网站备案地址,网站开发翻译,做教师知识网站有哪些内容,php制作网站后台AWS概述 EMR Serverless 简介 在AWS概述一文中简单介绍过AWS EMR, 它是AWS提供的云端大数据平台。借助EMR可以设置集群以便在几分钟内使用大数据框架处理和分析数据。创建集群可参考官方文档:Amazon EMR 入门。但集群创建之后需要一直运行,用户需要管理…

AWS概述
EMR Serverless

简介

在AWS概述一文中简单介绍过AWS EMR, 它是AWS提供的云端大数据平台。借助EMR可以设置集群以便在几分钟内使用大数据框架处理和分析数据。创建集群可参考官方文档:Amazon EMR 入门。但集群创建之后需要一直运行,用户需要管理集群的生命周期,包括启动、配置、监控和终止集群。因此EMR集群模式适用于需要长时间运行作业或者需要直接访问底层基础设施进行调试和运维的场景。

相比之下,EMR Serverless模式是一种无需管理集群的无服务器模式。用户只需提交作业,EMR Serverless会自动处理资源的部署、扩展和管理,按需提供计算资源。好处是无需管理集群,用户只需为实际使用的计算和存储资源付费,计算资源在作业完成之后会自动释放。下文将介绍如何创建EMR Serverless并提交作业。

创建EMR Serverless

首先需要一个Studio工作台,直接搜索EMR进入控制台,选择左侧EMR Serverless菜单,导航到landing页,点击“Get started”后会弹出提示窗口:
在这里插入图片描述

确认后AWS会创建一个默认的Studio和关联的Workspace,接下来会让你继续创建Application。这一步可以先停止,回退到工作台的dashboard也可以创建Application。创建Application时需要注意初始化选项,如果使用默认值,则应用的硬件资源基本是没有限制的。因此推荐使用自定义设置,将初始化资源容量和Application limit按照需要进行限制,防止使用过多资源:
在这里插入图片描述
Application创建完成之后,AWS会自动创建一个role,但这个role是aws管理的,不能做任何修改。
我们还需要创建一个新的role,用于执行job。步骤如下:

  • 先创建一个信任策略,如trust-policy.json
{"Version": "2012-10-17","Statement": [{"Effect": "Allow","Principal": {"Service": "emr-serverless.amazonaws.com"},"Action": "sts:AssumeRole"}]
}

该策略允许EMR Serverless服务(emr-serverless.amazonaws.com) 承担(assume)该角色。

  • 创建role
aws iam create-role --role-name EMRServerlessJobRole --assume-role-policy-document file://trust-policy.json

执行成功会返回角色的详细信息,包括ARN。

  • 创建角色策略1
aws iam create-policy --policy-name EMRServerlessS3AndGlueAccessPolicy --policy-document file://emr-custom-polocy.json# 策略文件内容
{"Version": "2012-10-17","Statement": [{"Sid": "ReadAccessForEMRSamples","Effect": "Allow","Action": ["s3:GetObject","s3:ListBucket"],"Resource": ["*"]},{"Sid": "FullAccessToOutputBucket","Effect": "Allow","Action": ["s3:PutObject","s3:GetObject","s3:ListBucket","s3:DeleteObject"],"Resource": ["*"]},{"Sid": "GlueCreateAndReadDataCatalog","Effect": "Allow","Action": ["glue:GetDatabase","glue:CreateDatabase","glue:GetDataBases","glue:CreateTable","glue:GetTable","glue:UpdateTable","glue:DeleteTable","glue:GetTables","glue:GetPartition","glue:GetPartitions","glue:CreatePartition","glue:BatchCreatePartition","glue:GetUserDefinedFunctions"],"Resource": ["*"]}]
}
  • 将角色策略附加给角色
aws iam attach-role-policy --role-name EMRServerlessJobRole --policy-arn arn:aws:iam::123456789:policy/EMRServerlessS3AndGlueAccessPolicy

创建S3桶

创建S3桶以便存储任务的输入和输出文件。下载官方文档Amazon EMR 入门提供的数据集和任务脚本,将其上传到所创建的S3 bucket中:
在这里插入图片描述

运行任务

现在Application和所需的role与S3资源都已经准备好了,可以运行任务了。

点击提交任务按钮,在任务界面输入Job的名称,选择上文创建好的角色,并从S3中选中任务脚本,指定脚本参数如下:

在这里插入图片描述

提交任务,稍等几分钟后即可看到运行结果。打开S3的输出文件夹可以看到具体处理后的结果信息。

提交任务时还可以选择demo任务,这是Spark自带的job示例。该job会输出Pi的值,无需S3和任务参数。

参考资料

[1].https://docs.aws.amazon.com/zh_cn/emr/latest/EMR-Serverless-UserGuide/getting-started.html

http://www.yayakq.cn/news/219279/

相关文章:

  • 网站登录界面源码门户网站的建设与维护
  • 玉田网站制作wordpress更新需要ftp
  • 天津专门做网站wordpress博客翻译
  • wordpress the_content() 不显示百度地图优化排名方法
  • 国家建设厅网站网站 续费
  • wordpress主题屋重庆seo网页优化
  • 郑州seo网站有优化爱心互助网站开发
  • 漳州市住房城乡建设局网站维护一个网站的费用
  • 建设银行保定分行网站公司百度网站怎么做
  • 广州做网站新锐个人作品链接怎么做
  • 网站优化有哪些技巧企业微信app下载安装教育版
  • 合肥制作网站网站建设肆金手指排名2
  • 网站首页布局设计代码品牌网站源码
  • 男女做暖暖视频网站北京中燕建设公司网站
  • 建设工程质量协会网站网页编辑简单分为网页美工编辑和
  • 淄博网站建设详细策划wordpress视频防止下载
  • 应用公园制作app软件下载seo网络营销案例分析
  • 中国设计者联盟官网奉化云优化seo
  • 自适应导航网站模板广告制作包括哪些
  • 定制网站开发流程免费发布产品网站
  • 无锡网站制作一般多少钱怎样下载网页上的视频
  • 外国做的中国动画视频网站网页设计素材资讯
  • 无锡网站建设 推荐无锡立威云商附近卖建筑模板市场
  • 江山集团网站建设外包做网站一般多少钱
  • 扬中网站建设机构加盟哪家装修公司好
  • 昆明网站建设frf手机必备20个软件
  • 哈尔滨网络建站的公司网站开发项目书
  • 网页设计与网站建设中的热点是什么陕西头条新闻最新消息
  • 网站提交了被收录后改怎么做别人买了域名做违法网站
  • 建立中英文网站网站制作用什么