我是编程新手,我已经查看了此问题的先前答案,但似乎没有与此特定查询相关。
我正在学习用python分析数据。
这是代码:
import pandas as pd
import os
os.chdir('/Users/Benjy/Documents/Python/Data Analysis Python')
unames = ['user_id', 'gender', 'age', 'occupation', 'zip']
users = pd.read_table('ml-1m/users.dat', sep='::', header = None, names = unames)
rnames = ['user_id', 'movie_id', 'rating', 'timestamp']
ratings = pd.read_table('ml-1m/ratings.dat', sep='::', header = None, names = rnames)
mnames = ['movie_id', 'title', 'genres']
movies = pd.read_table('ml-1m/movies.dat', sep='::', header = None, names = mnames)
data = pd.merge(pd.merge(ratings, users), movies)
mean_ratings=data.pivot_table('ratings',rows='title', cols='gender',aggfunc='mean')
我一直收到错误,说明没有定义mean_ratings ......但是肯定是在上面的最后一行代码中定义的?
答案 0 :(得分:1)
我认为这样可行:mean_ratings=data.pivot_table('rating',index='title',columns='gender',aggfunc='mean')