我有一个凌乱的文本文件,需要将其分类为数据框中的列,所以我 可以做我需要做的数据分析。这是看起来凌乱的文件: Messy text
我可以将其读取为csv文件,使用以下命令会更好一些:
import pandas as pd
data = pd.read_csv('phx_30kV_indepth_0_0_outfile.txt')
print(data)
这会打印出对齐的数据,但问题是输出为[640行x 1列]。而且我需要将其分为多个列,并将其作为数据框进行处理。
我曾经尝试过使用StringIO的许多解决方案,这些解决方案以前在这里都可以使用,但似乎没有解决办法。
但是,当我这样做时,问题是
答案 0 :(得分:1)
delim_whitespace=True
链接到文档^
df = pd.read_csv('phx_30kV_indepth_0_0_outfile.txt', delim_whitespace=True)
答案 1 :(得分:1)
您的输入文件实际上不是 CSV 格式。
由于您仅提供了 .png 图片,因此甚至不清楚该文件是否 分为几行。
如果没有,则必须先将内容“切割”成单独的行,然后 从输出文件中读取内容-剪切的结果。
我认为,这是第一步,您可以使用read_csv
或read_table
(当然,可以使用delim_whitespace=True
)。