应用错误收集

我正在尝试以编程方式阅读以Paint手绘的地图。地图如下所示：

我需要知道地图的每个像素属于哪个区域以及它们的名称是什么。

我想到了以下内容，但我想知道是否有更简单或更快（原始地图相当大）的方法：

检测区域：从每个像素填充并保存区域。这与文字不符。
检测文本/“噪音”：再次对每个像素进行泛光填充，但这次使用先前检测到的相邻像素区域作为边框。例如。当对“Abc”区域中的文本像素执行此操作时，不属于“Abc”周围区域的所有内容都将被淹没。然后丢弃具有特定数量的区域的区域，例如20个像素。这样做是为了匹配区域完全包含的字母（小区域）。
在图像文件中保存区域的像素（包括在 2 中检测到的像素），并将每个像素输入tesseract以获取该区域的名称。

我发现上面的方法相当复杂，而且似乎很慢（尽管我还没有完全实现）。它也不能处理缺少边框像素的完全闭合区域。有没有更简单/更好的解决方案呢？