应用错误收集

从自然图像中检测文本

时间：2017-08-10 13:23:40

标签： tensorflow computer-vision deep-learning ocr conv-neural-network

我在 tensorflow 中编写代码，使用卷积神经网络来检测来自图像的文本。我使用TFRecords文件来读取街景文本数据集，然后，我将图像的大小调整为<strong> 128 的高度和宽度。

我使用9- 转换层与零填充和三个 max_pool图层，窗口大小为（2×2），步幅为2 < / EM> 即可。由于我只使用三个汇集层，最后一层的形状将是（16×16）。最后一个转化层有'256'过滤器。

我也使用了两个回归完全连接图层（tf.nn.sigmoid）和tf.losses.mean_squared_error作为损失函数。

我的问题是这种架构足以用于检测过程吗？我知道有一些东西叫 NMS 进行检测。在这种情况下，标签是什么？

1 个答案:

答案 0 :(得分：1)

总的来说，这不是一个规则，只是根据我的经验，你应该从一个较小的网络2或3转换层开始，然后说出会发生什么，如果你得到一些好的结果更多地关注获胜的拓扑并适应超参数（learnrat，batchsize等等），如果你没有得到好结果那么深意义添加转换层。并再次评估。 12转是非常巨大的，你的问题复杂性也应该是巨大的！否则你会达到一个很好的准确性，但浪费了很多电脑的力量和时间！并顺便使用金字塔形式意义开始更宽，完成微小

相关问题

图像中文本检测的边缘检测问题

自然图像中的徽标检测/识别

从文本文档图像中提取文本检测特征

Magento自然图像

从自然图像中提取文本

从自然图像中检测文本

使用OpenCV改进自然图像中的OCR文本检测/分割

检测自然图像中的手写字母数字

Text detection in images

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？