我是H2o flow的新用户。没有太多的编码器,所以我喜欢点击界面。我想知道在建立模型并将其用于对数据集进行评分之后,是否有任何方式可以生成输出,从而告诉我每条记录,即评分是正确的原因。
作为示例,我创建了一个模型,该模型使用流程中的autoML功能来预测再次入院的风险。
它实际上确实工作得很好,但是当我使用它时,我会将高排名的患者发送给临床人员,他们想知道“为什么这个人获得高排名”。
是否有任何方法可以显示模型中的哪些变量导致对每个人的预测,作为我可以导出到数据库以供报表工具使用的输出?
谢谢!
答案 0 :(得分:0)
您的问题与机器学习可解释性技术有关。在H2O-3中,有两个可用选项:variable importance plot(可告诉您哪些功能对模型决策产生最大影响)和Partial Dependence Plots,可让您了解各个功能(也称为列或变量)会影响模型的平均预测。
有关可用的机器学习可解释性技术的概述,我建议您看一下H2O.ai的MLI booklet(尽管请注意,这些技术大部分仅在不同的产品中提供-因此如果您想使用它们,则必须自己编写技术代码)。