与Google Cloud Vision类似的SDK

时间:2019-01-30 11:34:21

标签: google-cloud-vision visual-recognition

我正在用C#开发一个系统,该系统需要解析键盘的图像并返回其中的字符位置。

我尝试使用IBM Watson,但是它不返回分类的位置,此后,我尝试使用Google Cloud Vision,因为在站点演示中它返回了JSON格式的字符的位置,但是我遇到了问题GOOGLE_APPLICATION_CREDENTIALS(看起来here)。

我想知道是否还有其他选择,最好是免费的或具有很多免费访问权,才能进行这种图像读取并返回字符的位置?

我不需要OCR,我想返回图像中字符的位置

1 个答案:

答案 0 :(得分:1)

ocr.space提供了一个不错的free ocr api。由于它“仅”是OCR API,因此使用起来比Google Cloud vision更容易。

C# OCR example project

  

以JSON格式返回字符的位置,

与该api相同。结果包含每个单词的边界框:

{
        "ParsedResults" : [
            {
                "TextOverlay" : {
                    "Lines" : [
                        {
                            "Words": [
                                {
                                "WordText": "Word 1",
                                "Left": 106,
                                "Top": 91,
                                "Height": 9,
                                "Width": 11
                                },
                                {
                                "WordText": "Word 2",
                                "Left": 121,
                                "Top": 90,
                                "Height": 13,
                                "Width": 51
                                }