使用目录中的* .jpeg和.csv文件中的相应标签准备张量流数据集

时间:2019-07-16 11:58:58

标签: tensorflow-datasets

实际上这个问题与先前类似,但对我来说,尝试先前的回答会抛出一个错误,我可能无法缩放,原因可能是功能已弃用,因此需要进行更新(真的请我下跪)–也许Windows 10是问题

在Google tensorflow文档中,他们大张旗鼓地简化了tensorflow,当然,通过准备好并准备好数据集,它们似乎也很容易 像mnist = tf.keras.datasets.mnist

但是对于使用新数据进行实际工作的人们,他们不会准备得如此整齐的数据。相反,他们(即我)将拍摄许多不同事物的照片(例如,来自64个患者案例的64个癌细胞核-每个250×250像素,带有RGB),并将64个jpeg存储在一个目录中,可以说C:\\Users\\dalton\\Desktop\\breast\\nuclei\\*.jpg 目录中除了感兴趣的jpg外没有其他jpg

然后在一个csv文本文件(本质上是一个电子表格,其中一列另存为csv文件或可以是txt)中,他们记录与每张图片相对应的标签-该文本文件有64个1或0项,其中1 =非常癌细胞坏,0 =还不错。可以说此txt文件位于:  C:\\Users\\dalton\\Desktop\\breast\\nuclei\\n_labels.txt

他们(我)将使用其中的32张图片和相应的标签来进行测试,并使用32张图片进行测试。

因此,从64个jpeg和64个标签(作为单个文本文件中的64个条目)的基本数据来看,如何达到加载简单示例中给出的相同点。还是只需要一个spreadsheet,其中一列带有jpeg文件名,另一列中带有标签,以便准备一个列表或元组?

本质上是如何

现实世界的工作与最后的共同途径一样  mnist = tf.keras.datasets.mnist

我认为对此的回答将帮助我之外的许多人。我在这里GitHub中尝试了无数示例,并尝试了R版本和完全沮丧。

真心感谢您的回答。 LD

尝试使用

解决方案的示例如下:

https://www.tensorflow.org/datasets/datasets

https://gist.github.com/eerwitt/518b0c9564e500b4b50f

0 个答案:

没有答案