应用错误收集

我一直有深度学习模型的问题。我有一个关于rrc数据框架的模型，如果我这样做：

rrc['preds'] = dp.cross_validation_holdout_predictions().as_data_frame().predict 我总是会错误地反应列和预测。在数据框的顶部有对齐，但在某些时候它们似乎是未对齐的，如果我计算它们之间的相关性是非常糟糕的，因为这种不对齐。我一直试图解决这个问题超过3天，但我不知道该怎么做。

我正在使用H2O 3.10.4.5。模型本身：

dp = H2ODeepLearningEstimator(activation = "Tanh", hidden = [10, 10, 10], epochs = 10000, keep_cross_validation_predictions=True, ignored_columns = ['fn', 'pdb_id','pdb_id_chain', 'pdb_id_chain_source', 'source']) dp.train(x = list(set(rrch.col_names) - set(['rmsd_all'])), y ="rmsd_all", training_frame = rrch, fold_column="cv")

编辑：我认为我发现了问题（Cell＃58）https://github.com/mmagnus/mmagnus.github.io/blob/master/mq-test.ipynb如果我rrc3 = rrc3[rrc3.rmsd_all < 10]删除rmsd_all（响应列）值大于10的某些行，那么我会{ {1}}导致了这个问题。我不知道为什么会这样。数据集，40mb https://www.dropbox.com/s/1et38o3xx47jw1m/rasp_rnakb_cv2.csv?dl=0

H2O中的交叉验证后的错位预测和响应列（深度学习）

1 个答案: