我有一个如下所示的数据框:
**L_Type L_ID C_Type E_Code**
0 1 1 9
0 1 2 9
0 1 3 9
0 1 4 9
0 2 1 2
0 2 2 2
0 2 3 2
0 2 4 2
0 3 1 3
0 3 2 3
0 3 3 3
0 3 4 3
我需要在每4行之后插入一个新行,并将第三列(C_Type)中的值增加01,如下表所示,同时保持与前两列相同的值,并且不要在最后一列中使用任何值:>
L_Type L_ID C_Type E_Code
0 1 1 9
0 1 2 9
0 1 3 9
0 1 4 9
0 1 5
0 2 1 2
0 2 2 2
0 2 3 2
0 2 4 2
0 2 5
0 3 1 3
0 3 2 3
0 3 3 3
0 3 4 3
0 3 5
我搜索了其他线程,但找不到确切的解决方案:
How to insert n DataFrame to another every nth row in Pandas?
答案 0 :(得分:1)
您可以通过切片来查看行,将1
添加到C_Type
列中,并将0.5
添加到索引中,以进行100%的切片,因为DataFrame.sort_index
中的默认排序方法是quicksort
。最后连接在一起,对索引进行排序,并使用concat
和drop=True
通过DataFrame.reset_index
创建默认值:
df['C_Type'] = df['C_Type'].astype(int)
df2 = (df.iloc[3::4]
.assign(C_Type = lambda x: x['C_Type'] + 1, E_Code = np.nan)
.rename(lambda x: x + .5))
df1 = pd.concat([df, df2], sort=False).sort_index().reset_index(drop=True)
print (df1)
L_Type L_ID C_Type E_Code
0 0 1 1 9.0
1 0 1 2 9.0
2 0 1 3 9.0
3 0 1 4 9.0
4 0 1 5 NaN
5 0 2 1 2.0
6 0 2 2 2.0
7 0 2 3 2.0
8 0 2 4 2.0
9 0 2 5 NaN
10 0 3 1 3.0
11 0 3 2 3.0
12 0 3 3 3.0
13 0 3 4 3.0
14 0 3 5 NaN