如何从数据框中提取整数?

时间:2018-11-07 00:05:00

标签: python pandas dataframe

我有一个熊猫DataFrame:

原始数据非常混乱,有成百上千的列和行,大部分是重复的,我能够尽我所能清除它,但遇到了这个障碍。现在,数据按以下方式存储:

    col
0   [6, str]
1   [37, str]
2   [72, str]
3   [104, str]
4   [142, str]
5   [174, str]
6   [206, str]
7   [244, str]
...

好像数据变成了一个包含“ [int,str]”元组为1列和N行的DataFrame。我只需要将“ str”值作为列名,将整数作为相同顺序的行即可。最终结果仍然是1xN DataFrame,但是删除所有重复的“ str”值并将其仅存储为列标题。

我需要对这些文件中包含的3个单独的“ str”值执行此操作,并将所有3个附加到一个巨型清理的DataFrame上,如下所示:

    str1, str2, str3 
0   int1, int2, int3
1   int1, int2, int3
2   int1, int2, int3
...

该脚本当前能够查找每个单独的str值,但是像第一个示例一样将它们全部存储。我可以弄清楚之后如何追加它们,但是如何去分离整数?

1 个答案:

答案 0 :(得分:0)

我自己找到了答案,谢谢。希望这对寻找相似内容的人有所帮助,它也是如此简单。

我将DataFrame变成了列表“ f”,然后这样做了:

for i in f:
    a.append(i[0])

现在,我已经将需要存储的数据存储在“ a”中,并且可以根据需要对其进行操作。 “ a”和“ f”是列表名称的任意示例。