我尝试在F#中导入CIFAR-10数据集“https://www.cs.toronto.edu/~kriz/cifar.html”,有三种格式; python,matlab(MAT)和二进制(bin)。请随时评论如何导入数据集?
答案 0 :(得分:5)
您必须使用数据集的二进制版本。 CIFAR页面上的描述非常清楚:
第一个字节是第一个图像的标签,它是0-9范围内的数字。接下来的3072个字节是图像像素的值。前1024个字节是红色通道值,下一个1024是绿色,最后1024个是蓝色。值以行主顺序存储,因此前32个字节是图像第一行的红色通道值。
您没有以任何方式指定如何导入数据集,以下是我认为有意义的内容:
SELECT COUNT(DISTINCT SUBSTRING(val,0,CHARINDEX('-', val))) from YourTable
文件.tar.gz