“Spark 基础之 DataFrame 基本概念学习”实验报告

DataFrame 基本概念学习

DataFrame 就是一种以 RDD 为基础、带有模式信息( Schema )的分布式数据集 实验楼

将数据下载解压后,启动spark-shell,将数据加载到spark中: 实验楼

使用printSchema检查格式完整性: 实验楼

最新评论
暂无评论~