如何解决此错误消息,“ ValueError:输入包含NaN,无穷大或对于dtype('float32')而言太大的值”
# Importing the libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
# Loading the dataset
data = pd.read_csv(r'C:\Users\sam.jones\Desktop\Fixed Income project\Data Pull\Data\Fixed Income_Data dump_2018.csv',error_bad_lines=False,encoding = "ISO-8859-2")
X = np.array([data.iloc[:,158].values])
Y = data.iloc[:,92].values
#Fitting Random Forest Regression to the dataset
from sklearn.ensemble import RandomForestRegressor
regressor = RandomForestRegressor(n_estimators = 10, random_state = 0)
regressor.fit(X,Y)
答案 0 :(得分:1)
输入的内容可能包含Nan。
因此,请使用np.nan_to_num(X)
首先用零填充它们。
答案 1 :(得分:0)
尝试声明一个变量。
x = x.fillna(test.mean())
答案 2 :(得分:0)
就我而言,错误是由于大数字造成的,特别是我发现了那些带有科学记数法的数字,例如 3.63E+08、1.25E+09... 解决方案是用更小的数字替换这些数字:您可以简单地用 x / 1000 替换它们,或者最好的解决方案是使用函数来缩放或规范化数据。之后,你可以训练你的模型