如何根据计数器列

时间:2015-07-17 22:00:49

标签: python pandas dataframe expand

假设我有一个名为df的数据框

x count 
d 2
e 3
f 2

计数将是计数器列和#次我希望它重复。

如何扩展它以使其成为

x count
d 2
d 2
e 3
e 3
e 3
f 2
f 2

我已经尝试过了 numpy.repeat(df,df.iloc ['count'])并且错误输出

2 个答案:

答案 0 :(得分:9)

您可以使用np.repeat()

import pandas as pd
import numpy as np

# your data
# ========================
df

   x  count
0  d      2
1  e      3
2  f      2

# processing
# ==================================
np.repeat(df.values, df['count'].values, axis=0)


array([['d', 2],
       ['d', 2],
       ['e', 3],
       ['e', 3],
       ['e', 3],
       ['f', 2],
       ['f', 2]], dtype=object)

pd.DataFrame(np.repeat(df.values, df['count'].values, axis=0), columns=['x', 'count'])

   x count
0  d     2
1  d     2
2  e     3
3  e     3
4  e     3
5  f     2
6  f     2

答案 1 :(得分:3)

您可以.loc使用repeat

In [295]: df.loc[df.index.repeat(df['count'])].reset_index(drop=True)
Out[295]:
   x  count
0  d      2
1  d      2
2  e      3
3  e      3
4  e      3
5  f      2
6  f      2

或者,使用pd.Series.repeat即可

In [278]: df.set_index('x')['count'].repeat(df['count']).reset_index()
Out[278]:
   x  count
0  d      2
1  d      2
2  e      3
3  e      3
4  e      3
5  f      2
6  f      2