被告知我在一个函数中这样做,我已经提到了一个非常好的主题。
这是python函数,传递的参数取自用户
def recommend(uid):
ds = pd.read_csv("pred_matrix-full_ubcf.csv")
records = ds.loc[ds['uid'] == uid]
for recom in records:
print recom
数据格式:
uid iid rat
344 1189 5
344 1500 5
344 814 5
736 217 3.3242361285
736 405 3.3238380154
736 866 3.323500531
331 1680 2
331 1665 2
331 36 1.999918585
无法到达我出错的地方,我正在关注 this1 线程但却无法获得它。
答案 0 :(得分:1)
要迭代您的行,请使用df.iterrows()
:
In [53]: records = df[df['uid'] == query]
In [54]: for index, row in records.iterrows():
...: print(row['uid'], row['iid'], row['rat'])
...:
344.0 1189.0 5.0
344.0 1500.0 5.0
344.0 814.0 5.0
还有两种可能的方法来选择您的数据。您可以使用boolean indexing
:
In [4]: query = 344
In [7]: df[df['uid'] == query]
Out[7]:
uid iid rat
0 344 1189 5.0
1 344 1500 5.0
2 344 814 5.0
您还可以使用DataFrame.query
功能:
In [8]: df.query('uid == %d' %query)
Out[8]:
uid iid rat
0 344 1189 5.0
1 344 1500 5.0
2 344 814 5.0
答案 1 :(得分:0)
您还可以立即在DataFrame对象上使用where()
方法。您可以为该方法提供条件作为第一个参数。请参见以下示例:
dataset.where(dataset['class']==0)
哪个会给出以下输出
f000001 f000002 f000003 ... f000102 f000103 class
0 0.000000 0.000000 0.000000 ... 0.000000 0.080000 0.0
1 0.000000 0.000000 0.000000 ... 0.000000 0.058824 0.0
2 0.000000 0.000000 0.000000 ... 0.000000 0.095238 0.0
3 0.029867 0.000000 0.012769 ... 0.000000 0.085106 0.0
4 0.000000 0.000000 0.000000 ... 0.000000 0.085106 0.0
5 0.000000 0.000000 0.000000 ... 0.000000 0.085106 0.0
6 0.000000 0.000000 0.000000 ... 0.000000 0.127660 0.0
7 0.000000 0.000000 0.000000 ... 0.000000 0.106383 0.0
8 0.000000 0.000000 0.000000 ... 0.000000 0.127660 0.0
9 0.000000 0.000000 0.000000 ... 0.000000 0.106383 0.0
10 0.000000 0.000000 0.000000 ... 0.000000 0.085106 0.0
11 0.021392 0.000000 0.000000 ... 0.000000 0.042553 0.0
12 -0.063880 -0.124403 -0.102466 ... 0.000000 0.042553 0.0
13 0.000000 0.000000 0.000000 ... 0.000000 0.021277 0.0
14 0.000000 0.000000 0.000000 ... 0.000000 0.000000 0.0
15 0.000000 0.000000 -0.060884 ... 0.000000 0.000000 0.0
[18323 rows x 104 columns]
(为简洁起见,我删除了其余的输出内容)
与仅引用相比,使用此方法的巨大优势在于,您可以使用other
参数来替换那些不符合条件的值,并使用来对符合条件的值执行一些操作inplace
参数。基本上,您可以根据需要重建数据框的行。
此外,由于此函数返回一个数据框减去与条件不匹配的行,因此您可以重新引用特定列,例如
dataset.where(dataset['class']==0)['f000001']
这将为您打印'f000001'
(第一个功能)列,其中类别标签为0。