MovieLens 数据集减半排序 Python 代码示例
以下是一个简单的示例代码,用于对 MovieLens 数据集进行减半排序,按照电影的评分进行排序:
import pandas as pd
# 加载 MovieLens 数据集
movies = pd.read_csv('movies.csv')
ratings = pd.read_csv('ratings.csv')
# 合并电影和评分数据集
movie_ratings = pd.merge(movies, ratings, on='movieId')
# 计算每部电影的平均评分
movie_avg_ratings = movie_ratings.groupby('movieId')['rating'].mean().reset_index()
# 对平均评分进行排序
sorted_movies = movie_avg_ratings.sort_values('rating', ascending=False)
# 取前一半的电影进行排序
half_sorted_movies = sorted_movies.head(len(sorted_movies) // 2)
# 打印排序结果
print(half_sorted_movies)
请确保已经下载并解压了 MovieLens 数据集,并将 'movies.csv' 和 'ratings.csv' 文件放在代码所在的目录中。此代码将加载电影数据集和评分数据集,并将它们合并在一起。然后,它计算每部电影的平均评分并根据评分进行排序。最后,代码将输出排名前一半的电影。
请注意,这只是一个简单的示例代码,你可能需要根据实际需求进行适当的修改。
原文地址: https://www.cveoy.top/t/topic/kMc 著作权归作者所有。请勿转载和采集!