我正在尝试将数据拆分为训练和测试数据集。我正在使用numpy制服方法。这是我的代码:
class JoinTable < ActiveRecord::Base
after_create :add_customer_values
def add_customer_values
customer = Customer.find self.customer_id
self.value1 = customer.value1
self.value2 = customer.value2
self.save
end
当我执行此代码时,出现以下错误:
self.fullData['is_train'] = np.random.uniform(0, 1, len(self.fullData)) <= .75
Train, Test = self.fullData[self.fullData['is_train']==True], self.fullData[self.fullData['is_train']==False]
在找到这个错误的解决方案之后,我想出了这个解决方案,就是我选择了特定的功能,其中我确信没有NaN值,而这些都是我想要的预测模型。这是代码:
ValueError: Input contains NaN, infinity or a value too large for dtype('float32').
然而,在执行上面的代码之后。我收到以下错误:
temp = DataFrame()
temp = self.fullData[list(self.features)].values[:,8]
temp['is_train'] = np.random.uniform(0, 1, len(temp)) <= .75
Train, Test = temp[temp['is_train']==True], temp[temp['is_train']==False]
我无法弄清楚代码或数据有什么问题。我需要一些帮助。