如何使用pymc3重新训练我的物流模型?

时间:2019-04-26 08:49:53

标签: machine-learning bayesian pymc3 inference mcmc

我有一个二进制分类问题,其中有大约15个功能。我使用其他模型选择了这些功能。现在,我想对这些功能执行贝叶斯物流。我的目标类别是高度不平衡的类别(少数民族类别为0.001%),我有大约600万条记录。我想建立一个可以使用贝叶斯物流在夜间或周末进行训练的模型。

当前,我已将数据分为15个部分,然后在第一部分训练模型并在最后一部分进行测试,然后使用Interpolated的{​​{1}}方法更新先验并重新运行使用第二组数据的模型。每次运行后,我都会检查准确性和其他指标(ROC,f1-分数)。

问题:

  1. 我的分数没有提高。
  2. 我使用正确的方法了吗?
  3. 此过程花费太多时间。

如果有人可以用正确的方法和代码段指导我,这对我将非常有帮助。

1 个答案:

答案 0 :(得分:0)

您可以使用变分推理。它比采样速度快,并且产生几乎相似的结果。 pymc3 本身提供了用于VI的方法,您可以进行探索。

我只知道这部分问题。如果您可以进一步阐述问题,也许..我可以帮助您。