影响图:确定性策略与随机策略

时间:2019-07-16 14:00:36

标签: policy markov-decision-process

我有一个影响图,可以用来决定休假活动。有决策节点(度假活动,其值可以为gonot go),2个不确定性节点(天气状况,天气预报)和1个值节点(满意度)。

[图见] https://en.wikipedia.org/wiki/Influence_diagram

从影响图的角度来看,决策者确定一种最佳策略,该策略可以最大化决策者的预期效用。

在这个问题上,决策者必须做出gonot go的决定,这被称为“确定性策略”。

为什么最优策略不是“ go的70%和not go的30%”?

0 个答案:

没有答案