import org.apache.spark.SparkContext
import org.apache.spark.SparkConf
import org.springframework.beans.factory.annotation.Autowired
import org.springframework.stereotype.Service
@Service
class SparkJobService @Autowired() (sparkContext: SparkContext) {
def runSparkJob(inputFilePath: String, outputFilePath: String): Unit = {
// 使用SparkContext执行Spark作业逻辑
val inputRDD = sparkContext.textFile(inputFilePath)
val mappedRDD = inputRDD.map(word => (word, 1))
val reducedRDD = mappedRDD.reduceByKey(_ + _)
reducedRDD.saveAsTextFile(outputFilePath)
}
}
这个简单的Scala示例展示了如何在Spring Boot应用程序中使用自动装配的SparkContext来执行一个简单的词频统计Spark作业。在这个例子中,我们假设已经配置了Spring Boot和Spark集成,并且有一个已经配置好的SparkContext
bean可以注入到SparkJobService
中。这个服务类的方法runSparkJob
定义了一个简单的Spark作业,读取输入文件,进行词频统计,然后将结果保存到输出文件。