我有一个带有以下列的Pandas数据框:
id start end
1 101 101
2 102 104
3 108 109
我想用其他行来填充开始和结束之间的间隙,因此输出可能如下所示:
id number
1 101
2 102
2 103
2 104
3 108
3 109
反正熊猫有做吗?谢谢。
答案 0 :(得分:3)
对range
使用嵌套列表推导,对元组列表进行展平,最后使用DataFrame
构造函数:
zipped = zip(df['id'], df['start'], df['end'])
df = pd.DataFrame([(i, y) for i, s, e in zipped for y in range(s, e+1)],
columns=['id','number'])
print (df)
id number
0 1 101
1 2 102
2 2 103
3 2 104
4 3 108
5 3 109
答案 1 :(得分:1)
这是一个纯粹的熊猫解决方案,但从性能角度考虑,@ jaezrael的解决方案会更好,
df.set_index('id').apply(lambda x: pd.Series(np.arange(x.start, x.end + 1)), axis = 1)\
.stack().astype(int).reset_index()\
.drop('level_1', 1)\
.rename(columns = {0:'Number'})
id Number
0 1 101
1 2 102
2 2 103
3 2 104
4 3 108
5 3 109