weijunzia L19 2016-08-03 23:41:57 DataFrame 入门
1350 0

“Spark 讲堂之 DataFrame 入门”实验报告

DataFrame 入门

val df = sqlContext.read.format("xxxx").load("/home/shiyanlou/1987.csv"); 由csv文件获取dataframe

dataframe可以看成一个表进行处理

df.col("列名') 获取指定列名的列

df.show(n) 显示指定行数的数据

df.take(n) 获取指定数量n的行数

df.groupBy(df.col("列名")) 以指定的列进行分组

val res = df.groupBy(df.col("列名")).agg(df.col("列名")) 对分组后的数据按另一列进行聚集

res.cache()对结果进行缓存

res.orderBy("res中的列名").show() 升序进行排列

res.sort($"res中的列名".desc).show() 降序进行排列

最新评论
暂无评论~