Question

我用：

Data = np.genfromtxt(filename, delimiter='"\t"', dtype=None, autostrip=True, skip_header=1)

在proccess中，它让我提出了ValueError（errmsg）

Line #33 (got 3 columns instead of 27)

但事实并非如此。在该行的文件中，我有所有列！我检查了 - 函数读取那些带有“缺失值”的行，直到一些符号：例如，在第33行中，函数读取：

"http://www.savvyeat.com/whole-wheat-chocolate-chai-muffins/"   "2152"  "{""title"":""Whole Wheat Chocolate Chai Muffins Savvy Eats "",""body"":""I think I subconsciously sabotaged myself Two weeks ago I couldn t

如何以其他方式读取numpy数组中的文件或以某种方式解决此问题？

Answer 1

一旦我们看到CSV文件的内容，就应该可以快速解决这类问题。要调试问题，请运行：

import itertools as IT
with open(filename, 'rb') as f:
    content = ''.join(IT.islice(f, 50))
    print(repr(content))

并发布输出。这将为我们提供该文件的前50行。如果有敏感数据，您可以在发布之前进行编辑;只需留下引号并\t完好无损。

Genfromtxt抛出异常“得到3列而不是27”，但事实并非如此

1 个答案: