我有一个包含格式化数据的巨大文本文件,如下所示
现在我想提取前两个字段,并将其保存为单独的文本或任何其他格式,如电子表格或任何其他应该如此的
50756,4f5e3a72e4b053fd6a4313f6
190571,4b4b87b5f964a5204a9f26e3
221021,4a85b1b3f964a520eefe1fe3
66981,4b4606f2f964a520751426e3
21010,4c2b4e8a9a559c74832f0de2
28761,4b4bade2f964a520cfa326e3
39350,49bbd6c0f964a520f4531fe3
1446,4e88cf4ed22d53877981fdab
82296,4dfc825bc65b31579b2e7679
因为我必须将它用作python程序的输入矩阵。我该怎么办?
答案 0 :(得分:0)
在Bash中,您可以:
cat input_file.txt | awk '{ print $1","$2 }' > output_file.txt
在Python中,您可以:
with open("input_file.txt", "r") as input_file:
with open("output_file.txt", "w") as output_file:
for line in input_file.readlines():
items = line.split()
output_file.write(items[0] + "," + items[1] + "\n")
我敢打赌,每天写一篇Python的人都可能会出现这样做,甚至更干净。任何人?