我用:
Data = np.genfromtxt(filename, delimiter='"\t"', dtype=None, autostrip=True, skip_header=1)
在proccess中,它让我提出了ValueError(errmsg)
Line #33 (got 3 columns instead of 27)
但事实并非如此。在该行的文件中,我有所有列!我检查了 - 函数读取那些带有“缺失值”的行,直到一些符号: 例如,在第33行中,函数读取:
"http://www.savvyeat.com/whole-wheat-chocolate-chai-muffins/" "2152" "{""title"":""Whole Wheat Chocolate Chai Muffins Savvy Eats "",""body"":""I think I subconsciously sabotaged myself Two weeks ago I couldn t
如何以其他方式读取numpy数组中的文件或以某种方式解决此问题?
答案 0 :(得分:1)
一旦我们看到CSV文件的内容,就应该可以快速解决这类问题。要调试问题,请运行:
import itertools as IT
with open(filename, 'rb') as f:
content = ''.join(IT.islice(f, 50))
print(repr(content))
并发布输出。这将为我们提供该文件的前50行。如果有敏感数据,您可以在发布之前进行编辑;只需留下引号并\t
完好无损。