Question

我正在查看Keras preprocessed IMDB dataset的文档，内容为：

按照惯例，“ 0”不代表特定单词，而是用于编码任何未知单词。

但是，尝试时，我在数据中看不到“ 0”：

(inputTrain, yTrain), (inputTest, yTest) = imdb.load_data(num_words=vocabSize)

我想念什么吗？我也看不到预处理代码here中添加了“ 0”。

Answer 1

按照惯例，“ 0”不代表特定单词，而是用于编码任何未知单词。

此处的文档有误。在Keras IMDB数据集中，值：

因此，在Keras IMDB数据集中，“ 2”用于未知单词，而不是“ 0”。