【文件属性】:
文件名称:DataFrame常用操作-spark介绍 spark入门
文件大小:2.37MB
文件格式:PPT
更新时间:2021-04-26 10:16:20
spark学习 spark介绍 大数据ppt spark ppt
DataFrame常用操作
DSL风格语法
//查看DataFrame中的内容
dataFrame.show()
//打印DataFrame的Schema信息
dataFrame.printSchema()
//查询某列所有数据
dataFrame.select(dataFrame.col("id"), dataFrame.col("name"), dataFrame.col("age")).show()
dataFrame.select("id", "name", "age").show()
//查询所有的name和age,并将age+1然后重新命名
dataFrame.select(dataFrame.col("name"), dataFrame.col("age").plus(1).as("age")).show()
//过滤age大于等于18的
dataFrame.filter(dataFrame.col("age").gt(18)).show()
dataFrame.filter(dataFrame("age") > 18).show()
//按年龄进行分组并统计相同年龄的人数
dataFrame.groupBy("age").count().show()