将数据和标头添加到新的数据框,并将文件名填充到列中

时间:2018-11-16 18:36:22

标签: python pandas dataframe

我有一个以下格式的数据框:

go build

我想用下面定义的空列标题来扩展它。不知何故,我收到了 fdate flag counter values 0 2008-08-18 0 0 1119881.78 1 2008-08-18 0 1 1922320.74 2 2008-08-18 0 2 3559026.11 3 2008-08-18 0 3 3510447.61 4 2008-08-18 0 4 4873269.42 5 2008-08-18 0 5 5098557.55 6 2008-08-18 0 6 4610888.45 ... 800 2008-08-18 0 999 -2177130.73 的双列。如何删除这些双列?使用以下命令删除我添加了fdate flag counter values的所有列。

如何添加任何数字,例如将整列插入df.T.drop_duplicates().T列中。

代码如下:

Group1

1 个答案:

答案 0 :(得分:1)

要将新列(例如Group1)添加为所有行的值为20的列,您可以通过简单的分配来做到这一点:

import pandas as pd

df = pd.DataFrame({'fdate': ['2008-08-18','2008-08-18','2008-08-18','2008-08-18'],
                'flag': [0, 0, 0, 0],
                'counter': [0, 1, 2, 3],
                'values': [103, 1422, 12312, 112]})

df['Group1'] = 20

收益:

        fdate  flag  counter  values  Group1
0  2008-08-18     0        0     103      20
1  2008-08-18     0        1    1422      20
2  2008-08-18     0        2   12312      20
3  2008-08-18     0        3     112      20

您可以为添加空列执行相同的操作,但是我不完全确定分配空列的目的:

import numpy as np

df['Empty'] = np.nan

收益:

        fdate  flag  counter  values  Group1  Empty
0  2008-08-18     0        0     103      20    NaN
1  2008-08-18     0        1    1422      20    NaN
2  2008-08-18     0        2   12312      20    NaN
3  2008-08-18     0        3     112      20    NaN