我正在尝试创建用于文本识别的CNN Tensor-flow,我已经按照如何使用MNIST数据集构建它的教程,我想要做的是将我自己的数据集添加到模型中并训练它,但CNN是在监督下建立的,我的数据集没有标记。我应该如何为数据集添加标签,我尝试使用不同类型的标签方法,例如labelbox和Amazon Mechanical Turk,但没有成功。有没有办法标记数据集或将CNN转换为无监督?
示例数据集:
答案 0 :(得分:1)
有几种标记数据集的工具我个人使用以下工具,它对我来说效果很好,用python编写,很容易使用,你可以在这里找到软件和说明:https://github.com/tzutalin/labelImg < / p>
如果它不适合你,你可以考虑其他工具: