带有IMDB数据集的文本分类get_word_index错误,如何更改路径

时间:2019-08-13 08:02:41

标签: python tensorflow keras

由于我位于代理后面,因此无法直接访问IMDB数据集,因此我将完整的程序包保存在:

    <?php
        $image=$_POST['image'];    
        $decodedImage=base64_decode($image); //no double quotes
        file_put_contents("/membri/motivationalapp/shareImages/" . "prova" . ".JPEG", $decodedImage); //JPEG instead of jpg
        echo "ok";
    ?>

我可以成功加载以下命令:

C:\Users\...\.keras\datasets\imdb.npz

我有火车和测试数据的地方。

当我想继续使用basic text classification时,我必须得到单词index:

# save np.load
np_load_old = np.load
# modify the default parameters of np.load
np.load = lambda *a,**k: np_load_old(*a, allow_pickle=True, **k)
imdb = keras.datasets.imdb
(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)
# restore np.load for future normal usage
np.load = np_load_old

我(再次)得到错误:

word_index = imdb.get_word_index()

如何避免这种情况?

我知道我可以调整路径:

Exception: URL fetch failure on https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb_word_index.json: None -- [Errno 11004] getaddrinfo failed

但是我的正确道路是什么?

1 个答案:

答案 0 :(得分:1)

同样,再次练习,从https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb_word_index.json下载文件并将其放入C:\Users\<your_username>\.keras\datasets内,然后照常使用get_word_index