检测报纸的文章区(文本块)

时间:2016-06-10 00:18:28

标签: java xml edges

我必须自动检测基于边缘的报纸的所有文本区域(欢迎新想法)。

我需要的结果是包含每篇文章的许多TXT文件。 看看这个演示。

enter image description here

1 个答案:

答案 0 :(得分:0)

这个问题太宽泛了。

如果你想要一个正确的答案,那么你需要提出非常具体的问题并向我们展示你的尝试。我们甚至不知道您需要使用哪种格式,因此除了猜测之外我们无法提供任何真正的帮助。

说完了:

您可能希望使用image recognition software

要研究的一个很好的API是OpenCV:http://opencv.org/

以下是有关如何将OpenCV与Java一起使用的教程:http://docs.opencv.org/3.0-last-rst/doc/tutorials/introduction/desktop_java/java_dev_intro.html

以下是两个可能对您有帮助的类似问题:

Finding location of rectangles in an image with OpenCV

How to recognize rectangles in this image?