我有一个大文本文件,其格式为:
ID Data
1 4,5,6,7,2,3,4
3 1,2,3,6,2,1,3
2 1,5,4,2,3,2,8
将此加载到2d numpy数组中的有效方法是什么,其中ID用作行索引,Data分为整数值。我查看了loadtxt
和genfromtxt
,但无法弄清楚如何有效地处理两级数据格式 - 标签然后是逗号。
根据要求,我目前的解决方案是:
import numpy as np
import csv
size = (3, 7)
arr = np.zeros(size)
with open(filename, 'r') as f:
reader = csv.reader(f, delimiter='\t')
next(reader)
for id, data in reader:
arr[int(id) - 1] = [int(x) for x in data.split(',')]
print arr