Python Spark: 计算文本文件数据平均值

日期: 2024-06-09
标签: 常规

from pyspark.sql import SparkSession

spark = SparkSession.builder.appName('AverageScore').getOrCreate() lines = spark.read.text('data01.txt').rdd.map(lambda x: x[0]) score = lines.map(lambda x: int(x.split()[2])) num = score.count() total_score = score.reduce(lambda x, y: x + y) avg = total_score / num print(avg)

原文地址: https://www.cveoy.top/t/topic/kH4 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录

上一篇: 移动中台业务，用于很多应用不能上应用商店提供苹果签名与下载安卓的打包与下载优化一下话术用于项目描述
下一篇: Python坦克大战游戏代码示例：使用Pygame实现