使用条件从数据框打印特定行

时间:2017-07-08 08:50:04

标签: python pandas dataframe

被告知我在一个函数中这样做,我已经提到了一个非常好的主题。

这是python函数,传递的参数取自用户

def recommend(uid):
    ds = pd.read_csv("pred_matrix-full_ubcf.csv")
    records = ds.loc[ds['uid'] == uid]
    for recom in records:
        print recom

数据格式:

uid iid     rat
344 1189    5
344 1500    5
344 814     5
736 217     3.3242361285
736 405     3.3238380154
736 866     3.323500531
331 1680    2
331 1665    2
331 36      1.999918585

简称: this1this2

无法到达我出错的地方,我正在关注 this1 线程但却无法获得它。

2 个答案:

答案 0 :(得分:1)

要迭代您的行,请使用df.iterrows()

In [53]: records = df[df['uid'] == query]

In [54]: for index, row in records.iterrows():
    ...:     print(row['uid'], row['iid'], row['rat'])
    ...: 
344.0 1189.0 5.0
344.0 1500.0 5.0
344.0 814.0 5.0

还有两种可能的方法来选择您的数据。您可以使用boolean indexing

In [4]: query = 344

In [7]: df[df['uid'] == query]
Out[7]: 
   uid   iid  rat
0  344  1189  5.0
1  344  1500  5.0
2  344   814  5.0

您还可以使用DataFrame.query功能:

In [8]: df.query('uid == %d' %query)
Out[8]: 
   uid   iid  rat
0  344  1189  5.0
1  344  1500  5.0
2  344   814  5.0

答案 1 :(得分:0)

您还可以立即在DataFrame对象上使用where()方法。您可以为该方法提供条件作为第一个参数。请参见以下示例:

dataset.where(dataset['class']==0)

哪个会给出以下输出

        f000001   f000002   f000003  ...     f000102   f000103  class
0      0.000000  0.000000  0.000000  ...    0.000000  0.080000    0.0
1      0.000000  0.000000  0.000000  ...    0.000000  0.058824    0.0
2      0.000000  0.000000  0.000000  ...    0.000000  0.095238    0.0
3      0.029867  0.000000  0.012769  ...    0.000000  0.085106    0.0
4      0.000000  0.000000  0.000000  ...    0.000000  0.085106    0.0
5      0.000000  0.000000  0.000000  ...    0.000000  0.085106    0.0
6      0.000000  0.000000  0.000000  ...    0.000000  0.127660    0.0
7      0.000000  0.000000  0.000000  ...    0.000000  0.106383    0.0
8      0.000000  0.000000  0.000000  ...    0.000000  0.127660    0.0
9      0.000000  0.000000  0.000000  ...    0.000000  0.106383    0.0
10     0.000000  0.000000  0.000000  ...    0.000000  0.085106    0.0
11     0.021392  0.000000  0.000000  ...    0.000000  0.042553    0.0
12    -0.063880 -0.124403 -0.102466  ...    0.000000  0.042553    0.0
13     0.000000  0.000000  0.000000  ...    0.000000  0.021277    0.0
14     0.000000  0.000000  0.000000  ...    0.000000  0.000000    0.0
15     0.000000  0.000000 -0.060884  ...    0.000000  0.000000    0.0

[18323 rows x 104 columns]

(为简洁起见,我删除了其余的输出内容)

与仅引用相比,使用此方法的巨大优势在于,您可以使用other参数来替换那些不符合条件的值,并使用来对符合条件的值执行一些操作inplace参数。基本上,您可以根据需要重建数据框的行。

此外,由于此函数返回一个数据框减去与条件不匹配的行,因此您可以重新引用特定列,例如

dataset.where(dataset['class']==0)['f000001']

这将为您打印'f000001'(第一个功能)列,其中类别标签为0。