我有一个包含38列和1500多行的csv,其中包含浮点数和字符串。我想要从这个集合中的3列(x,y,z)浮点数据来找到f=(x+y)/z
的平均值。经过研究,我成功地将这些列分离为numpy数组并执行f=(x+y)/z
。现在当我尝试总结f时,数组没有加起来。我打印f我看到1500项正确的值,但不是这些的总和。
reader=csv.reader(open('myfile.csv' ,"rb"),delimiter=',')
reader.next()
reader.next()
x=list(reader)
data=numpy.array(x)
rows=data.shape[0]
for i in range (0,rows):
x=numpy.array(data[i,18]).astype('float')
y=numpy.array(data[i,19]).astype('float')
z=numpy.array(data[i,6]).astype('float')
f=numpy.array((x+y)/z)
average=numpy.sum(f)/rows
print average
答案 0 :(得分:5)
如果data
已经是数组,则不需要for
循环:
x = data[:, 18].astype(float)
y = data[:, 19].astype(float)
z = data[:, 6].astype(float)
f = (x+y) / z
average = np.average(f)
使用np.loadtxt
阅读文件可能会更好:
data = np.loadtxt('myfile.csv', dtype=float, delimiter=',' skiprows=2,
usecols=(6, 18, 19))
或直接获取x
,y
和z
:
x, y, z = np.loadtxt('myfile.csv', dtype=float, delimiter=',' skiprows=2,
usecols=(6, 18, 19), unpack=True)
答案 1 :(得分:2)
Numpy允许您作为一个整体操作数组,您不需要遍历它们。
reader=csv.reader(open('myfile.csv' ,"rb"),delimiter=',')
reader.next()
reader.next()
x=list(reader)
data=numpy.array(x)
rows=data.shape[0]
x=data[:,18].astype('float')
y=data[:,19].astype('float')
z=data[:,6].astype('float')
f = (x + y) / z
average = f.mean()
print average
答案 2 :(得分:0)
如果你没有陷入numpy这里是一个纯粹的python解决方案,
import csv
def f(x, y, z):
x = float(x)
y = float(y)
z = float(z)
return (x+y)/z
reader = csv.reader(open("derp.csv", 'r'))
rows = list(reader)
len_of_rows = len(rows)
f_values = []
for row in rows:
x = row[0]
y = row[1]
z = row[2]
f_values.append(f(x, y, z))
average = sum(f_values)/len_of_rows
print average
这是我的derp.csv的样子
1,2,3
4,5,6
7,8,9