我有一个大的(对于我的经验水平)天体物理数据的文本文件,我正试图获得python / pandas的句柄。作为蟒蛇的菜鸟,它慢慢地来了。 Here是文本文件的示例,总文件为145Mb。当我试图在熊猫中读到这篇文章时,我感到困惑,因为我不知道该使用pd.read_table(example.txt)
或pd.read_csv(example.csv)
。无论哪种情况,我都不能在没有ipython吓坏的情况下调用特定列,例如here。我知道我正在做一些心不在焉的事情。任何人都可以解释那可能是什么?我用较小的文件完成了相同的程序并且效果很好,但是这个程序似乎限制了它的输出,或者根本就没有工作。
感谢。
答案 0 :(得分:1)
看起来您的列以不同数量的空格分隔,因此您需要将其指定为分隔符。试试read_csv(example.csv, sep=r'\s+')
。 \s+
是“任意数量的空格”的正则表达式。此外,您应该从第一行的开头删除#
字符,因为这将被读作额外的列并且会弄乱读数。