标签: neural-network lstm softmax
我正在学习seq2seq神经模型,我对常规softmax和softmax采样感到困惑。有人告诉我,采样的softmax主要用于大词汇量。那么任何人都可以直观地解释两者之间的区别吗?