val df = sqlContext.read.format("xxxx").load("/home/shiyanlou/1987.csv"); 由csv文件获取dataframe
dataframe可以看成一个表进行处理
df.col("列名') 获取指定列名的列
df.show(n) 显示指定行数的数据
df.take(n) 获取指定数量n的行数
df.groupBy(df.col("列名")) 以指定的列进行分组
val res = df.groupBy(df.col("列名")).agg(df.col("列名")) 对分组后的数据按另一列进行聚集
res.cache()对结果进行缓存
res.orderBy("res中的列名").show() 升序进行排列
res.sort($"res中的列名".desc).show() 降序进行排列
学习时间 85分钟
操作时间 45分钟
按键次数 1048次
实验次数 1次
报告字数 387字
是否完成 未完成