关于学徒学习算法步骤

时间:2015-11-15 23:40:18

标签: machine-learning reinforcement-learning

我一直关注这里的论文http://ai.stanford.edu/~ang/papers/icml04-apprentice.pdf,但无法弄清楚3.1节中的除法符号表示的操作。所有mu矢量都是相同的维度;我们该如何与他们进行分工?

1 个答案:

答案 0 :(得分:0)

它看起来像是典型的数字划分。你有一些形式

A^T B
-----
C^T D

其中A, B, CD是向量,因此A^T B是一个数字(它只是一个点积),因此C^T D