这似乎相当明显,但我似乎无法弄清楚如何将数据框的索引转换为列?
例如:
df=
gi ptt_loc
0 384444683 593
1 384444684 594
2 384444686 596
要,
df=
index1 gi ptt_loc
0 0 384444683 593
1 1 384444684 594
2 2 384444686 596
答案 0 :(得分:534)
或者:
df['index1'] = df.index
或,.reset_index
:
df.reset_index(level=0, inplace=True)
所以,如果你有一个包含3个索引级别的多索引框架,比如:
>>> df
val
tick tag obs
2016-02-26 C 2 0.0139
2016-02-27 A 2 0.5577
2016-02-28 C 6 0.0303
并且您希望将索引中的第一个(tick
)和第三个(obs
)级别转换为列,您可以这样做:
>>> df.reset_index(level=['tick', 'obs'])
tick obs val
tag
C 2016-02-26 2 0.0139
A 2016-02-27 2 0.5577
C 2016-02-28 6 0.0303
答案 1 :(得分:28)
对于MultiIndex,您可以使用
提取其子索引df['si_name'] = R.index.get_level_values('si_name')
其中si_name
是子索引的名称。
答案 2 :(得分:14)
为了更清晰一些,让我们看一下其索引中有两个级别的DataFrame(MultiIndex)。
index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'],
['North', 'South']],
names=['State', 'Direction'])
df = pd.DataFrame(index=index,
data=np.random.randint(0, 10, (6,4)),
columns=list('abcd'))
使用默认参数调用的reset_index
方法将所有索引级别转换为列,并使用简单的RangeIndex
作为新索引。
df.reset_index()
使用level
参数控制将哪些索引级别转换为列。如果可能,请使用更明确的级别名称。如果没有级别名称,则可以通过其整数位置引用每个级别,该位置从外部开始为0。您可以在此处使用标量值,也可以使用要重置的所有索引的列表。
df.reset_index(level='State') # same as df.reset_index(level=0)
在极少数情况下,您希望保留索引并将索引转换为列,您可以执行以下操作:
# for a single level
df.assign(State=df.index.get_level_values('State'))
# for all levels
df.assign(**df.index.to_frame())
答案 3 :(得分:4)
rename_axis
+ reset_index
您可以先将索引重命名为所需标签,然后 提升为一系列:
df = df.rename_axis('index1').reset_index()
print(df)
index1 gi ptt_loc
0 0 384444683 593
1 1 384444684 594
2 2 384444686 596
这对于MultiIndex
数据帧也适用:
print(df)
# val
# tick tag obs
# 2016-02-26 C 2 0.0139
# 2016-02-27 A 2 0.5577
# 2016-02-28 C 6 0.0303
df = df.rename_axis(['index1', 'index2', 'index3']).reset_index()
print(df)
index1 index2 index3 val
0 2016-02-26 C 2 0.0139
1 2016-02-27 A 2 0.5577
2 2016-02-28 C 6 0.0303
答案 4 :(得分:2)
如果要使用reset_index
方法并保留现有索引,则应使用:
df.reset_index().set_index('index', drop=False)
或更改其位置:
df.reset_index(inplace=True)
df.set_index('index', drop=False, inplace=True)
例如:
print(df)
gi ptt_loc
0 384444683 593
4 384444684 594
9 384444686 596
print(df.reset_index())
index gi ptt_loc
0 0 384444683 593
1 4 384444684 594
2 9 384444686 596
print(df.reset_index().set_index('index', drop=False))
index gi ptt_loc
index
0 0 384444683 593
4 4 384444684 594
9 9 384444686 596
如果您想摆脱索引标签,可以这样做:
df2 = df.reset_index().set_index('index', drop=False)
df2.index.name = None
print(df2)
index gi ptt_loc
0 0 384444683 593
4 4 384444684 594
9 9 384444686 596
答案 5 :(得分:1)
这应该可以解决问题(如果不是多级索引) -
df.reset_index().rename({'index':'index1'}, axis = 'columns')
当然,如果您不想在 rename 的函数参数中将其分配给新变量,您可以随时设置 inplace = True。
答案 6 :(得分:0)
df1 = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})
p = df1.index.values
df1.insert( 0, column="new",value = p)
df1
new gi ptt
0 0 232 342
1 1 66 56
2 2 34 662
3 3 43 123
答案 7 :(得分:-2)
一种非常简单的方法是使用reset_index()方法。对于数据帧df,请使用以下代码:
df.reset_index(inplace=True)
这样,索引将成为一列,并且通过使用inplace作为True,这将成为永久更改。