我有一个state->动作对的数据集,(s,a),其中每个s定义了a的可能选择的概率分布,并且每个a都是从该概率分布中采样的。我想为这个数据集训练一个分类器,而不是学习预测最大似然,而是预测从中采样的分布。
例如,如果你正在玩一个迭代的石头剪刀,你的状态可能只是你做的上一个动作和∈{Rock,Paper,Scissors},其中前一个状态降低了选择它的概率再次行动。我的数据集看起来像:
PreviousAction,Chosen
Rock,Paper
Paper,Rock
Rock,Scissors
Scissors,Paper
Paper,Paper
...
是否有可能在scikit-learn中使用随机森林的标签学习概率分布?
答案 0 :(得分:1)
是的,确实如此。使用fit
(期望标签,而非概率分布,作为其y
参数)训练RandomForestClassifier
,然后使用predict_proba
进行预测。