我一直有深度学习模型的问题。我有一个关于rrc数据框架的模型,如果我这样做:
rrc['preds'] = dp.cross_validation_holdout_predictions().as_data_frame().predict
我总是会错误地反应列和预测。在数据框的顶部有对齐,但在某些时候它们似乎是未对齐的,如果我计算它们之间的相关性是非常糟糕的,因为这种不对齐。我一直试图解决这个问题超过3天,但我不知道该怎么做。
我正在使用H2O 3.10.4.5。 模型本身:
dp = H2ODeepLearningEstimator(activation = "Tanh", hidden = [10, 10, 10], epochs = 10000,
keep_cross_validation_predictions=True,
ignored_columns = ['fn', 'pdb_id','pdb_id_chain', 'pdb_id_chain_source', 'source'])
dp.train(x = list(set(rrch.col_names) - set(['rmsd_all'])), y ="rmsd_all", training_frame = rrch,
fold_column="cv")
编辑:我认为我发现了问题(Cell#58)https://github.com/mmagnus/mmagnus.github.io/blob/master/mq-test.ipynb如果我rrc3 = rrc3[rrc3.rmsd_all < 10]
删除rmsd_all(响应列)值大于10的某些行,那么我会{ {1}}导致了这个问题。我不知道为什么会这样。数据集,40mb https://www.dropbox.com/s/1et38o3xx47jw1m/rasp_rnakb_cv2.csv?dl=0
答案 0 :(得分:0)
解决:rrc3.reset_index(inplace=True)
将完成这项工作!