Question

我有一个包含格式化数据的巨大文本文件，如下所示

现在我想提取前两个字段，并将其保存为单独的文本或任何其他格式，如电子表格或任何其他应该如此的

50756,4f5e3a72e4b053fd6a4313f6

190571,4b4b87b5f964a5204a9f26e3

221021,4a85b1b3f964a520eefe1fe3

66981,4b4606f2f964a520751426e3

21010,4c2b4e8a9a559c74832f0de2

28761,4b4bade2f964a520cfa326e3

39350,49bbd6c0f964a520f4531fe3

1446,4e88cf4ed22d53877981fdab

82296,4dfc825bc65b31579b2e7679

因为我必须将它用作python程序的输入矩阵。我该怎么办？

Answer 1

在Bash中，您可以：

cat input_file.txt | awk '{ print $1","$2 }' > output_file.txt

在Python中，您可以：

with open("input_file.txt", "r") as input_file:
    with open("output_file.txt", "w") as output_file:
        for line in input_file.readlines():
            items = line.split()
            output_file.write(items[0] + "," + items[1] + "\n")

我敢打赌，每天写一篇Python的人都可能会出现这样做，甚至更干净。任何人？

以所需方式格式化文本文件数据

1 个答案: