Scala 代码示例:统计省份商品点击数并排序
Scala 代码示例:统计省份商品点击数并排序
本示例展示了如何使用 Scala 代码统计多个省份不同商品的点击数,并将结果按点击数进行升序排序。
object A {
def main(args: Array[String]): Unit = {
// 原始数据
val data = Map(
(('吉林', '玉米'), 2),
(('吉林', '袜子'), 10),
(('河南', '山药'), 18),
(('河南', '鞋'), 3),
(('河南', '衣服'), 9),
(('河北', '箱包'), 11),
(('河北', '鸭梨'), 5),
(('吉林', '木耳'), 7)
)
// 转换数据格式:将 (('省份', '商品'), 点击数) 转换为 (省份, 商品, 点击数)
val transformedData = data.map { case ((province, product), clicks) => (province, product, clicks) }
// 按省份分组:将转换后的数据按省份进行分组
val groupedData = transformedData.groupBy(_._1)
// 统计每个省份所有商品点击数量的总数:遍历每个省份,计算该省份下所有商品的点击数之和
val clicksByProvince = groupedData.map { case (province, productList) =>
(province, productList.map(_._3).sum)
}
// 对结果进行升序排序:将统计结果转换为 List,然后按照点击数进行升序排序
val sortedResult = clicksByProvince.toList.sortBy(_._2)
println(clicksByProvince) // 输出 Map(河南 -> 30, 吉林 -> 19, 河北 -> 16)
println(sortedResult) // 输出 List((河北,16), (吉林,19), (河南,30))
}
}
代码解析:
- 原始数据定义:使用
Map定义了原始数据,其中 key 为 ('省份', '商品') 元组,value 为点击数。 - 数据格式转换:使用
map函数将原始数据中的 key 从 ('省份', '商品') 元组转换为 (省份, 商品, 点击数) 三元组。 - 按省份分组:使用
groupBy函数将转换后的数据按省份进行分组,得到一个Map[String, List[(String, String, Int)]],其中 key 为省份,value 为该省份下的所有商品信息列表。 - 统计每个省份的总点击数:使用
map函数遍历每个省份,计算该省份下所有商品的点击数之和,得到一个Map[String, Int],其中 key 为省份,value 为该省份的总点击数。 - 对结果进行排序:使用
toList将Map转换为List,然后使用sortBy函数按照点击数进行升序排序。
输出结果:
Map(吉林 -> 19, 河南 -> 30, 河北 -> 16)
List((河北,16), (吉林,19), (河南,30))
代码修改:
将输出语句中的 HashMap 改为 Map 即可。
println(clicksByProvince) // 输出 Map(河南 -> 30, 吉林 -> 19, 河北 -> 16)
println(sortedResult) // 输出 List((河北,16), (吉林,19), (河南,30))
总结:
本示例展示了如何使用 Scala 代码进行数据处理,包括数据转换、分组、统计和排序等操作。这些操作可以应用于各种数据分析和处理场景。
原文地址: https://www.cveoy.top/t/topic/kvZc 著作权归作者所有。请勿转载和采集!