当前位置: 首页 > news >正文

腾讯云重装wordpress上海网站优化

腾讯云重装wordpress,上海网站优化,九一人才网赣州找工作,网站登陆页面怎么做文章目录 1. 查看数据文件2. 读取数据文件得到单例数据帧3. 将单列数据帧转换成多列数据帧 在本次实战中,我们的目标是将存储在HDFS上的以逗号分隔的文本文件student.txt转换为结构化的Spark DataFrame。首先,使用spark.read.text读取文件,得…

文章目录

  • 1. 查看数据文件
  • 2. 读取数据文件得到单例数据帧
  • 3. 将单列数据帧转换成多列数据帧

  • 在本次实战中,我们的目标是将存储在HDFS上的以逗号分隔的文本文件student.txt转换为结构化的Spark DataFrame。首先,使用spark.read.text读取文件,得到一个包含单列value的DataFrame。然后,利用split函数按逗号分割每行字符串,并通过withColumn和类型转换cast创建新的列idnamegenderage。最后,使用drop函数移除原始的value列,并使用showprintSchema验证转换结果。通过这一系列操作,我们成功地将原始文本数据转换为具有明确数据类型和列名的结构化数据集,为后续的数据分析和处理打下了基础。

1. 查看数据文件

  • 执行命令:hdfs dfs -cat /student/input/student.txt
    在这里插入图片描述

2. 读取数据文件得到单例数据帧

  • 执行命令:val df = spark.read.text("hdfs://master:9000/student/input/student.txt")
    在这里插入图片描述
  • 执行命令:df.show
    在这里插入图片描述

3. 将单列数据帧转换成多列数据帧

val stuDF = df.withColumn("id", split(col("value"), ",")(0).cast("int")).withColumn("name", split(col("value"), ",")(1)).withColumn("gender", split(col("value"), ",")(2)).withColumn("age", split(col("value"), ",")(3).cast("int")).drop("value") // 删除原始的 value 列
  • 执行上述命令
    在这里插入图片描述
  • 执行命令:stuDF.printSchema
    在这里插入图片描述
  • 执行命令:stuDF.show
    在这里插入图片描述
http://www.yayakq.cn/news/415270/

相关文章:

  • Wordpress球队网站哈尔滨公司网站团队
  • 如何在网站上做自动弹出写男主重生做网站的小说
  • 东莞建设银行官方网站网站开发工作分解结构
  • 建设银行网站是什么深圳网站建设公司官网
  • 国外网站可以访问吗ui培训费
  • 网页制作与网站建设广州小游戏网址代码
  • PHP网站开发成功案例eclipse开发安卓app
  • 免费驾校网站模板易语言怎么做网站自动登录
  • 网站建设常见的问题重庆中小企业名录
  • 阿里云增加网站临沧网站建设公司招聘
  • 假网站怎么制作网站建设的优势是什么
  • 汕头网站建设怎么收费网页版传奇单职业
  • 哈尔滨网站设计报价淘宝购买网站建设
  • 做类似慕课网的网站要多少钱公司注册好了怎么做网站
  • 小企业网站建设的连接方式米拓建站最新进展
  • wordpress500东莞网站seo优化托管
  • 动力网站代码哪里能搜索引擎优化
  • 电商网站的特点网站报价详情
  • 中法电商网站建设wordpress+边框插件
  • 如何确认建设银行网站不是假的登建设厅锁子的是哪个网站
  • 响应式网站多少钱网站建设首选智投未来1
  • 一流的邯郸网站建设网络服务器搭建与管理
  • 最新做做网站免费自己的公网ip可以做网站
  • 公司做外贸网站账号权重查询入口站长工具
  • 不花钱做推广的网站用python做网站的公司
  • 天津网站优化实战百度手机助手下载免费安装
  • 网站建设企业服务wordpress自适应手机
  • 江西赣建建设监理网站找代理公司注册公司需要注意什么
  • 如何做网站短链接WordPress网页小游戏
  • 网站建设近义词电商设计师网站