标记数据集以进行深度机器学习

时间:2018-02-24 13:14:28

标签: tensorflow deep-learning mnist supervised-learning unsupervised-learning

我正在尝试创建用于文本识别的CNN Tensor-flow,我已经按照如何使用MNIST数据集构建它的教程,我想要做的是将我自己的数据集添加到模型中并训练它,但CNN是在监督下建立的,我的数据集没有标记。我应该如何为数据集添加标签,我尝试使用不同类型的标签方法,例如labelbox和Amazon Mechanical Turk,但没有成功。有没有办法标记数据集或将CNN转换为无监督?

示例数据集:

Here is an example for the data-set

1 个答案:

答案 0 :(得分:1)

有几种标记数据集的工具我个人使用以下工具,它对我来说效果很好,用python编写,很容易使用,你可以在这里找到软件和说明:https://github.com/tzutalin/labelImg < / p>

如果它不适合你,你可以考虑其他工具: