Python-pandas具有大/无序文本文件

时间:2013-05-16 03:33:35

标签: python pandas

我有一个大的(对于我的经验水平)天体物理数据的文本文件,我正试图获得python / pandas的句柄。作为蟒蛇的菜鸟,它慢慢地来了。 Here是文本文件的示例,总文件为145Mb。当我试图在熊猫中读到这篇文章时,我感到困惑,因为我不知道该使用pd.read_table(example.txt)pd.read_csv(example.csv)。无论哪种情况,我都不能在没有ipython吓坏的情况下调用特定列,例如here。我知道我正在做一些心不在焉的事情。任何人都可以解释那可能是什么?我用较小的文件完成了相同的程序并且效果很好,但是这个程序似乎限制了它的输出,或者根本就没有工作。

感谢。

1 个答案:

答案 0 :(得分:1)

看起来您的列以不同数量的空格分隔,因此您需要将其指定为分隔符。试试read_csv(example.csv, sep=r'\s+')\s+是“任意数量的空格”的正则表达式。此外,您应该从第一行的开头删除#字符,因为这将被读作额外的列并且会弄乱读数。