Genfromtxt抛出异常“得到3列而不是27”,但事实并非如此

时间:2013-08-31 09:19:32

标签: python file-io numpy genfromtxt

我用:

Data = np.genfromtxt(filename, delimiter='"\t"', dtype=None, autostrip=True, skip_header=1)

在proccess中,它让我提出了ValueError(errmsg)

Line #33 (got 3 columns instead of 27)

但事实并非如此。在该行的文件中,我有所有列!我检查了 - 函数读取那些带有“缺失值”的行,直到一些符号: 例如,在第33行中,函数读取:

"http://www.savvyeat.com/whole-wheat-chocolate-chai-muffins/"   "2152"  "{""title"":""Whole Wheat Chocolate Chai Muffins Savvy Eats "",""body"":""I think I subconsciously sabotaged myself Two weeks ago I couldn t

如何以其他方式读取numpy数组中的文件或以某种方式解决此问题?

1 个答案:

答案 0 :(得分:1)

一旦我们看到CSV文件的内容,就应该可以快速解决这类问题。要调试问题,请运行:

import itertools as IT
with open(filename, 'rb') as f:
    content = ''.join(IT.islice(f, 50))
    print(repr(content))

并发布输出。这将为我们提供该文件的前50行。如果有敏感数据,您可以在发布之前进行编辑;只需留下引号并\t完好无损。