Question

我正在用C＃开发一个系统，该系统需要解析键盘的图像并返回其中的字符位置。

我尝试使用IBM Watson，但是它不返回分类的位置，此后，我尝试使用Google Cloud Vision，因为在站点演示中它返回了JSON格式的字符的位置，但是我遇到了问题GOOGLE_APPLICATION_CREDENTIALS（看起来here）。

我想知道是否还有其他选择，最好是免费的或具有很多免费访问权，才能进行这种图像读取并返回字符的位置？

我不需要OCR，我想返回图像中字符的位置

Answer 1

ocr.space提供了一个不错的free ocr api。由于它“仅”是OCR API，因此使用起来比Google Cloud vision更容易。

C# OCR example project

以JSON格式返回字符的位置，

与该api相同。结果包含每个单词的边界框：

{
        "ParsedResults" : [
            {
                "TextOverlay" : {
                    "Lines" : [
                        {
                            "Words": [
                                {
                                "WordText": "Word 1",
                                "Left": 106,
                                "Top": 91,
                                "Height": 9,
                                "Width": 11
                                },
                                {
                                "WordText": "Word 2",
                                "Left": 121,
                                "Top": 90,
                                "Height": 13,
                                "Width": 51
                                }

与Google Cloud Vision类似的SDK

1 个答案: