如何按降序排列pandas dataframe列

时间:2016-01-26 05:51:25

标签: python pandas

我有像这样的pandas数据帧tsp_data_unique ..

      order_id    quant_bought    Clusters
 0       537            2         Cluster 2
 1       540            1         Cluster 10
 2       541            1         Cluster 4
 3       542            2         Cluster 2
 4       543            2         Cluster 2
 5       545            3         Cluster 2
 6       546            2         Cluster 2
 7       548            3         Cluster 1
 8       549            3         Cluster 6
 9       550            4         Cluster 2
 10      553            1         Cluster 11
 11      555            1         Cluster 1
 12      556            1         Cluster 1
 13      557            1         Cluster 3
 14      584            3         Cluster 2
 15      586            3         Cluster 2
 16      587            3         Cluster 5
 17      588            1         Cluster 7
 18      589            1         Cluster 10
 19      590            1         Cluster 9
 20      591            2         Cluster 2
 21      592            3         Cluster 2
 22      593            1         Cluster 2
 23      594            7         Cluster 8
 24      595            3         Cluster 2
 25      596            1         Cluster 1
 26      608            2         Cluster 2
 27      609            4         Cluster 2

第二个数据框为df

      Clusters                                           order_id
0    Cluster 1                               [548, 555, 556, 596]
1   Cluster 10                                         [540, 589]
2   Cluster 11                                              [553]
3    Cluster 2  [537, 542, 543, 545, 546, 550, 584, 586, 591, ...
4    Cluster 3                                              [557]
5    Cluster 4                                              [541]
6    Cluster 5                                              [587]
7    Cluster 6                                              [549]
8    Cluster 7                                              [588]
9    Cluster 8                                              [594]
10   Cluster 9                                              [590] 

现在,我想在第一个数据框中按order_id's列的降序排列Cluster 2 dfClusters数据框quant_bought列的 p = df.order_id[df['Clusters'] == 'Cluster 2'] a = tsp_data_unique['order_id'].isin(p.values[0]) b = tsp_data_unique['quant_bought'][a] b.sort() b = b[::-1] p = tsp_data_unique['order_id'][b.index] list_p = p.values.tolist() df.order_id[df['Clusters'] == 'Cluster 2'] = list_p

我在python中做了以下。

Cluster 2

当我将降序有序列表分配到df中的ValueError: Length of replacements must equal series length时,它会给我一个错误

$app->get('/login/user_table(/:username)', function($username) use ($app){ user_table_view($username); });

请帮助..

3 个答案:

答案 0 :(得分:1)

希望这有帮助。

In [25]: tsp_data_unique
Out[25]: 
   order_id  quant_bought  cluster
0       537             2        4
1       540             1        3
2       541             5        4
3       542             1        4
4       544             2        3

In [26]: df = tsp_data_unique.sort_values(['cluster', 'order_id'], ascending=[True, False]).groupby('cluster')['order_id'].apply(lambda x: x.tolist())

In [27]: df
Out[27]: 
cluster
3         [544, 540]
4    [542, 541, 537]
Name: order_id, dtype: object

答案 1 :(得分:1)

我认为使用列中的列表并不容易。

如果index值,df['Clusters'] == 'Cluster 2'只有一个,则可以使用iloc

p  =  df.order_id[df['Clusters'] == 'Cluster 2']
a = tsp_data_unique['order_id'].isin(p.values[0])
b = tsp_data_unique['quant_bought'][a]  
#replace sort to sort_values, because future warning 
b.sort_values(inplace=True) 
b = b[::-1]
p = tsp_data_unique['order_id'][b.index]
list_p = p.values

print list_p
[550 586 584 545 591 546 543 542 537]

idx = df[df['Clusters'] == 'Cluster 2'].index[0]

print idx
1

df['order_id'].iloc[idx] =  list_p

print df.iloc[idx]
Clusters                                        Cluster 2
order_id    [550, 586, 584, 545, 591, 546, 543, 542, 537]
Name: 1, dtype: object

答案 2 :(得分:0)

在这里,您尝试将列表指定为数据框中的元素。但是,它期望列表中的单个值如[ 5 ]。由于您分配的列表长度为> 1,并且您尝试替换的值的长度仅为1,因此长度不匹配,Python会抛出错误。

要解决此问题,请尝试使用列表作为另一个列表的第一个元素,如下所示:

df.order_id[df['Clusters'] == 'Cluster 2'] = [ list_p ]