熊猫按逻辑日对数据框进行排序

时间:2018-11-24 00:09:49

标签: python pandas sorting dataframe indexing

enter image description here

我有以下生成的熊猫DateFrame: 我怎样才能使它正确排序?例如,进行排序以使第2天排在第1天之后,而不是第11天。如下面的第2组所示?

2 个答案:

答案 0 :(得分:3)

set_levels + sort_index

问题是您的字符串被按字符串形式 而不是数字进行排序。首先将您的第一个索引级别转换为数字,然后按索引排序:

# split by whitespace, take last split, convert to integers
new_index_values = df.index.levels[1].str.split().str[-1].astype(int)

# set 'Day' level
df.index = df.index.set_levels(new_index_values, level='Day')

# sort by index
df = df.sort_index()

print(df)

           Value
Group Day       
A     0        1
      2        3
      11       2
B     5        5
      7        6
      10       4

设置

上面的演示使用此示例设置:

df = pd.DataFrame({'Group': ['A', 'A', 'A', 'B', 'B', 'B'],
                   'Day': ['Day 0', 'Day 11', 'Day 2', 'Day 10', 'Day 5', 'Day 7'],
                   'Value': [1, 2, 3, 4, 5, 6]}).set_index(['Group', 'Day'])

print(df)

              Value
Group Day          
A     Day 0       1
      Day 11      2
      Day 2       3
B     Day 10      4
      Day 5       5
      Day 7       6

答案 1 :(得分:1)

您需要对整数而不是字符串进行排序:

import pandas as pd
x = pd.Series([1,2,3,4,6], index=[3,2,1,11,12])
x.sort_index()

1     3
2     2
3     1
11    4
12    6
dtype: int64

y = pd.Series([1,2,3,4,5], index=['3','2','1','11','12'])
y.sort_index()

1     3
11    4
12    5
2     2
3     1
dtype: int64

我建议该列中仅包含数字,而不是字符串“ Day ..”。