Question

我有一个熊猫DataFrame：

原始数据非常混乱，有成百上千的列和行，大部分是重复的，我能够尽我所能清除它，但遇到了这个障碍。现在，数据按以下方式存储：

    col
0   [6, str]
1   [37, str]
2   [72, str]
3   [104, str]
4   [142, str]
5   [174, str]
6   [206, str]
7   [244, str]
...

好像数据变成了一个包含“ [int，str]”元组为1列和N行的DataFrame。我只需要将“ str”值作为列名，将整数作为相同顺序的行即可。最终结果仍然是1xN DataFrame，但是删除所有重复的“ str”值并将其仅存储为列标题。

我需要对这些文件中包含的3个单独的“ str”值执行此操作，并将所有3个附加到一个巨型清理的DataFrame上，如下所示：

    str1, str2, str3 
0   int1, int2, int3
1   int1, int2, int3
2   int1, int2, int3
...

该脚本当前能够查找每个单独的str值，但是像第一个示例一样将它们全部存储。我可以弄清楚之后如何追加它们，但是如何去分离整数？

Answer 1

我自己找到了答案，谢谢。希望这对寻找相似内容的人有所帮助，它也是如此简单。

我将DataFrame变成了列表“ f”，然后这样做了：

for i in f:
    a.append(i[0])

现在，我已经将需要存储的数据存储在“ a”中，并且可以根据需要对其进行操作。 “ a”和“ f”是列表名称的任意示例。