我正在尝试使用CNTK CTFDeserializer读取SVHN数据集。 SVHN数据集是.mat数据集。所以我使用scipy.io.loadmat加载它们并尝试修改https://github.com/Microsoft/CNTK/blob/master/Tutorials/CNTK_103A_MNIST_DataLoader.ipynb以读取数据,将其展平并将其存储为txt。和https://github.com/Microsoft/CNTK/blob/master/Tutorials/CNTK_201B_CIFAR-10_ImageHandsOn.ipynb读取和重塑txt文件并运行CNN模型。
它让我“在输入文件中找不到偏移201303500处的有效输入名称”错误。
我的txt文件的格式如下73257次。 | labels 1 0 0 0 0 0 0 0 0 0 | feature 33 30 for(3 * 32 * 32 times)
答案 0 :(得分:0)
错误可能发生在文件末尾附近(可能并非所有输出都被刷新到文件中?)。要弄清楚出现了什么问题,请将数据的子集写入文件并手动检查文件的结尾。在代码库中搜索错误并未产生任何结果,但如果您提供准确的错误消息,我可以更新此答案。
如果您将数据集作为numpy数组,则另一种可能性就是切掉微型计算机并将其提供给cntk。 CNTK教程104和106展示了如何做到这一点。