标签: torch loss cross-entropy
我想实现AlphaZero论文,为此,我需要计算树的蒙特卡洛策略与净输出的对数之间的交叉熵损失。
这是一个问题,因为torch.nn.CrossEntropyLoss()仅支持单热矢量分类,并且torch.nn.BCELoss()不支持非0> = x <= 1的目标值。我真的不知道该怎么做或使用哪个标准。任何帮助将不胜感激!