我有一个二进制分类问题,其中有大约15个功能。我使用其他模型选择了这些功能。现在,我想对这些功能执行贝叶斯物流。我的目标类别是高度不平衡的类别(少数民族类别为0.001%),我有大约600万条记录。我想建立一个可以使用贝叶斯物流在夜间或周末进行训练的模型。
当前,我已将数据分为15个部分,然后在第一部分训练模型并在最后一部分进行测试,然后使用Interpolated
的{{1}}方法更新先验并重新运行使用第二组数据的模型。每次运行后,我都会检查准确性和其他指标(ROC,f1-分数)。
问题:
如果有人可以用正确的方法和代码段指导我,这对我将非常有帮助。
答案 0 :(得分:0)
您可以使用变分推理。它比采样速度快,并且产生几乎相似的结果。 pymc3 本身提供了用于VI的方法,您可以进行探索。
我只知道这部分问题。如果您可以进一步阐述问题,也许..我可以帮助您。