我有一个csv文件,我必须计算一些列的平均值。 这就是我的表现:
file=csv.reader(open('tab.csv','r'))
n=[]
for row in file:
n.append(row[8])
所以我有一个字符串列表:n = ['','',' 1.58' ...] 如何将这些转换为浮动? 我尝试过:
n_values=np.array(n)
n_values[n=='']='0'
values=n_values.astype(np.float)
np.mean(values)
但是平均值不正确,因为我应该跳过不计算的空字符串。 谢谢您帮忙!
答案 0 :(得分:9)
在追加时加注:
n.append(float(row[8]))
如果有空字符串,请在追加之前捕获它们。
try:
n.append(float(row[8]))
except ValueError:
continue
或者你可能想尝试一下pandas,特别是pandas.read_csv:
import pandas as pd
df = pd.read_csv("in.csv")
print(df["col_name"].mean())
答案 1 :(得分:1)
只需添加引语:
with open('tab.csv', newline='') as file:
reader = csv.reader(file, quoting=csv.QUOTE_NONNUMERIC)
n=[]
for row in reader:
n.append(row[8])