我有一个熊猫DataFrame:
原始数据非常混乱,有成百上千的列和行,大部分是重复的,我能够尽我所能清除它,但遇到了这个障碍。现在,数据按以下方式存储:
col
0 [6, str]
1 [37, str]
2 [72, str]
3 [104, str]
4 [142, str]
5 [174, str]
6 [206, str]
7 [244, str]
...
好像数据变成了一个包含“ [int,str]”元组为1列和N行的DataFrame。我只需要将“ str”值作为列名,将整数作为相同顺序的行即可。最终结果仍然是1xN DataFrame,但是删除所有重复的“ str”值并将其仅存储为列标题。
我需要对这些文件中包含的3个单独的“ str”值执行此操作,并将所有3个附加到一个巨型清理的DataFrame上,如下所示:
str1, str2, str3
0 int1, int2, int3
1 int1, int2, int3
2 int1, int2, int3
...
该脚本当前能够查找每个单独的str值,但是像第一个示例一样将它们全部存储。我可以弄清楚之后如何追加它们,但是如何去分离整数?
答案 0 :(得分:0)
我自己找到了答案,谢谢。希望这对寻找相似内容的人有所帮助,它也是如此简单。
我将DataFrame变成了列表“ f”,然后这样做了:
for i in f:
a.append(i[0])
现在,我已经将需要存储的数据存储在“ a”中,并且可以根据需要对其进行操作。 “ a”和“ f”是列表名称的任意示例。