Scala 代码:根据省份和商品统计点击数量并排序
Scala 代码示例:根据省份和商品统计点击数量并排序
object A {
def main(args: Array[String]): Unit = {
// 原始数据
val data = Map(
(('吉林', '玉米'), 2),
(('吉林', '袜子'), 10),
(('河南', '山药'), 18),
(('河南', '鞋'), 3),
(('河南', '衣服'), 9),
(('河北', '箱包'), 11),
(('河北', '鸭梨'), 5),
(('吉林', '木耳'), 7)
)
// 转换数据格式:将 (('省份', '商品'), 点击数) 转换为 (省份, 商品, 点击数)
val transformedData = data.map { case ((province, product), clicks) => (province, product, clicks) }
// 按省份分组:将转换后的数据按省份进行分组
val groupedData = transformedData.groupBy(_._1)
// 统计每个省份所有商品点击数量的总数:遍历每个省份,计算该省份下所有商品的点击数之和
val clicksByProvince = groupedData.map { case (province, productList) =>
(province, productList.map(_._3).sum)
}
// 对结果进行升序排序:将统计结果转换为 List,然后按照点击数进行升序排序
val sortedResult = clicksByProvince.toList.sortBy(_._2)
println(clicksByProvince.toMap) // 输出 Map(河南 -> 30, 吉林 -> 19, 河北 -> 16)
println(sortedResult) // 输出 List((河北,16), (吉林,19), (河南,30))
}
}
代码说明:
- 原始数据: 使用
Map存储原始数据,其中键为元组('省份', '商品'),值为点击数量。 - 转换数据格式: 使用
map函数将原始数据转换为(省份, 商品, 点击数)的三元组格式。 - 按省份分组: 使用
groupBy函数将转换后的数据按照省份进行分组。 - 统计点击数量: 遍历每个省份,使用
map函数计算该省份下所有商品的点击数量之和。 - 排序: 使用
toList和sortBy函数将统计结果转换为列表并按照点击数量进行升序排序。
输出结果:
Map(河南 -> 30, 吉林 -> 19, 河北 -> 16)
List((河北,16), (吉林,19), (河南,30))
注意:
- 代码中使用
println(clicksByProvince.toMap)将HashMap转换为Map。 - 可以根据实际需求对代码进行修改,例如添加对商品的统计等。
总结:
本代码示例展示了如何使用 Scala 对包含省份、商品和点击数量的数据进行处理,并根据省份统计每个省份所有商品的点击数量之和,最终按照点击数量进行排序。代码简洁易懂,可作为学习 Scala 数据处理的参考。
原文地址: https://www.cveoy.top/t/topic/kvXR 著作权归作者所有。请勿转载和采集!