应用错误收集

Python-pandas具有大/无序文本文件

时间：2013-05-16 03:33:35

标签： python pandas

我有一个大的（对于我的经验水平）天体物理数据的文本文件，我正试图获得python / pandas的句柄。作为蟒蛇的菜鸟，它慢慢地来了。 Here是文本文件的示例，总文件为145Mb。当我试图在熊猫中读到这篇文章时，我感到困惑，因为我不知道该使用pd.read_table(example.txt)或pd.read_csv(example.csv)。无论哪种情况，我都不能在没有ipython吓坏的情况下调用特定列，例如here。我知道我正在做一些心不在焉的事情。任何人都可以解释那可能是什么？我用较小的文件完成了相同的程序并且效果很好，但是这个程序似乎限制了它的输出，或者根本就没有工作。

感谢。

1 个答案:

答案 0 :(得分：1)

看起来您的列以不同数量的空格分隔，因此您需要将其指定为分隔符。试试read_csv(example.csv, sep=r'\s+')。 \s+是“任意数量的空格”的正则表达式。此外，您应该从第一行的开头删除#字符，因为这将被读作额外的列并且会弄乱读数。