H2O中的交叉验证后的错位预测和响应列(深度学习)

时间:2017-04-26 10:38:02

标签: python deep-learning cross-validation h2o

我一直有深度学习模型的问题。我有一个关于rrc数据框架的模型,如果我这样做:

rrc['preds'] = dp.cross_validation_holdout_predictions().as_data_frame().predict 我总是会错误地反应列和预测。在数据框的顶部有对齐,但在某些时候它们似乎是未对齐的,如果我计算它们之间的相关性是非常糟糕的,因为这种不对齐。我一直试图解决这个问题超过3天,但我不知道该怎么做。

我正在使用H2O 3.10.4.5。 模型本身:

dp = H2ODeepLearningEstimator(activation = "Tanh", hidden = [10, 10, 10], epochs = 10000, keep_cross_validation_predictions=True, ignored_columns = ['fn', 'pdb_id','pdb_id_chain', 'pdb_id_chain_source', 'source']) dp.train(x = list(set(rrch.col_names) - set(['rmsd_all'])), y ="rmsd_all", training_frame = rrch, fold_column="cv")

编辑:我认为我发现了问题(Cell#58)https://github.com/mmagnus/mmagnus.github.io/blob/master/mq-test.ipynb如果我rrc3 = rrc3[rrc3.rmsd_all < 10]删除rmsd_all(响应列)值大于10的某些行,那么我会{ {1}}导致了这个问题。我不知道为什么会这样。数据集,40mb https://www.dropbox.com/s/1et38o3xx47jw1m/rasp_rnakb_cv2.csv?dl=0

1 个答案:

答案 0 :(得分:0)

解决:rrc3.reset_index(inplace=True)将完成这项工作!