用Scala编写spark工程代码
这是一个简单的Spark工程代码示例,使用Scala编写:
import org.apache.spark.sql.SparkSession
object MySparkJob {
def main(args: Array[String]): Unit = {
// 创建SparkSession对象
val spark = SparkSession.builder()
.appName("My Spark Job")
.master("local[*]")
.getOrCreate()
// 读取数据文件
val data = spark.read.csv("data.csv")
// 处理数据
val result = data.filter(row => row.getString(0) == "A")
// 输出结果
result.show()
// 关闭SparkSession对象
spark.stop()
}
}
在这个示例中,我们首先创建了一个SparkSession对象,然后使用它来读取一个csv数据文件。我们使用Spark SQL中的filter函数来过滤数据,然后使用show函数来显示结果。最后,我们关闭SparkSession对象。
原文地址: http://www.cveoy.top/t/topic/btHM 著作权归作者所有。请勿转载和采集!