应用错误收集

标记数据集以进行深度机器学习

时间：2018-02-24 13:14:28

标签： tensorflow deep-learning mnist supervised-learning unsupervised-learning

我正在尝试创建用于文本识别的CNN Tensor-flow，我已经按照如何使用MNIST数据集构建它的教程，我想要做的是将我自己的数据集添加到模型中并训练它，但CNN是在监督下建立的，我的数据集没有标记。我应该如何为数据集添加标签，我尝试使用不同类型的标签方法，例如labelbox和Amazon Mechanical Turk，但没有成功。有没有办法标记数据集或将CNN转换为无监督？

示例数据集：

Here is an example for the data-set

1 个答案:

答案 0 :(得分：1)

有几种标记数据集的工具我个人使用以下工具，它对我来说效果很好，用python编写，很容易使用，你可以在这里找到软件和说明：https://github.com/tzutalin/labelImg < / p>

如果它不适合你，你可以考虑其他工具：

列出项目https://github.com/cvhciKIT/sloth
列出项目https://github.com/Labelbox/Labelbox