MovieLens 数据集减半排序 Python 代码示例

以下是一个简单的示例代码，用于对 MovieLens 数据集进行减半排序，按照电影的评分进行排序：

import pandas as pd

# 加载 MovieLens 数据集
movies = pd.read_csv('movies.csv')
ratings = pd.read_csv('ratings.csv')

# 合并电影和评分数据集
movie_ratings = pd.merge(movies, ratings, on='movieId')

# 计算每部电影的平均评分
movie_avg_ratings = movie_ratings.groupby('movieId')['rating'].mean().reset_index()

# 对平均评分进行排序
sorted_movies = movie_avg_ratings.sort_values('rating', ascending=False)

# 取前一半的电影进行排序
half_sorted_movies = sorted_movies.head(len(sorted_movies) // 2)

# 打印排序结果
print(half_sorted_movies)

请确保已经下载并解压了 MovieLens 数据集，并将 'movies.csv' 和 'ratings.csv' 文件放在代码所在的目录中。此代码将加载电影数据集和评分数据集，并将它们合并在一起。然后，它计算每部电影的平均评分并根据评分进行排序。最后，代码将输出排名前一半的电影。

请注意，这只是一个简单的示例代码，你可能需要根据实际需求进行适当的修改。