Python编程 - numpy polyfit说NAN

时间:2012-12-03 01:24:55

标签: python numpy nan

我遇到了一些我编写的非常简单的代码问题。我有4组数据,并希望使用numpy polyfit生成多项式最佳拟合线。当使用polyfit时,列表中的3个产生数量,但是当使用polyfit时,第三个数据集产生NAN。下面是代码和打印输出。有任何想法吗?

代码:

所有'ind _#'都是数据列表。下面将它们转换为numpy数组,然后可以生成多项式最佳拟合线

ind_1=np.array(ind_1, np.float)

dep_1=np.array(dep_1, np.float)

x_1=np.arange(min(ind_1)-1, max(ind_1)+1, .01)

ind_2=np.array(ind_2, np.float)

dep_2=np.array(dep_2, np.float)

x_2=np.arange(min(ind_2)-1, max(ind_2)+1, .01)

ind_3=np.array(ind_3, np.float)

dep_3=np.array(dep_3, np.float)

x_3=np.arange(min(ind_3)-1, max(ind_3)+1, .01)

ind_4=np.array(ind_4, np.float)

dep_4=np.array(dep_4, np.float)

x_4=np.arange(min(ind_4)-1, max(ind_4)+1, .01)

下面打印出上面生成的数组,以及polyfit列表的内容,它们通常是多项式方程的系数,但对于下面的第三种情况,所有polyfit内容都打印为NAN

print(ind_1)

print(dep_1)

print(np.polyfit(ind_1,dep_1,2))

print(ind_2)

print(dep_2)

print(np.polyfit(ind_2,dep_2,2))

print(ind_3)

print(dep_3)

print(np.polyfit(ind_3,dep_3,2))

print(ind_4)

print(dep_4)

print(np.polyfit(ind_4,dep_4,2))

打印出来:

[ 1.405  1.871  2.713 ...,  5.367  5.404  2.155]

[ 0.274  0.07   0.043 ...,  0.607  0.614  0.152]

[ 0.01391925 -0.00950728  0.14803846]

[ 0.9760001  2.067      8.8       ...,  1.301      1.625      2.007    ]

[ 0.219      0.05       0.9810001 ...,  0.163      0.161      0.163    ]

[ 0.00886807 -0.00868727  0.17793324]

[ 1.143      0.9120001  2.162     ...,  2.915      2.865      2.739    ]

[ 0.283  0.3    0.27  ...,  0.227  0.213  0.161]

[ nan  nan  nan]

[ 0.167  0.315  1.938 ...,  2.641  1.799  2.719]

[ 0.6810001  0.7140001  0.309     ...,  0.283      0.313      0.251    ]

[ 0.00382331  0.00222269  0.16940372]

为什么第三种情况下的polyfit常数列为NAN?所有数据集都具有相同类型的数据,并且所有代码都是一致的。请帮忙。

1 个答案:

答案 0 :(得分:16)

只是查看了你的数据。之所以发生这种情况,是因为NaN中有dep_3(元素713)。您可以确保只在拟合中使用有限值,如下所示:

idx = np.isfinite(ind_3) & np.isfinite(dep_3)
print(np.polyfit(ind_3[idx], dep_3[idx], 2))

对于在大型数据集中查找错误值,numpy非常容易。你可以找到这样的指数:

print(np.where(~np.isfinite(dep_3)))