Question

我是编程新手，我已经查看了此问题的先前答案，但似乎没有与此特定查询相关。

我正在学习用python分析数据。

这是代码：

import pandas as pd

import os

os.chdir('/Users/Benjy/Documents/Python/Data Analysis Python')

unames = ['user_id', 'gender', 'age', 'occupation', 'zip']
users = pd.read_table('ml-1m/users.dat', sep='::', header = None, names = unames)

rnames = ['user_id', 'movie_id', 'rating', 'timestamp'] 
ratings = pd.read_table('ml-1m/ratings.dat', sep='::', header = None, names = rnames)

mnames = ['movie_id', 'title', 'genres']
movies = pd.read_table('ml-1m/movies.dat', sep='::', header = None, names = mnames)

data = pd.merge(pd.merge(ratings, users), movies)


mean_ratings=data.pivot_table('ratings',rows='title', cols='gender',aggfunc='mean')

我一直收到错误，说明没有定义mean_ratings ......但是肯定是在上面的最后一行代码中定义的？

Answer 1

我认为这样可行：mean_ratings=data.pivot_table('rating',index='title',columns='gender',aggfunc='‌mean')

数据分析期间未定义的变量

1 个答案: