我正在用C#开发一个系统,该系统需要解析键盘的图像并返回其中的字符位置。
我尝试使用IBM Watson,但是它不返回分类的位置,此后,我尝试使用Google Cloud Vision,因为在站点演示中它返回了JSON格式的字符的位置,但是我遇到了问题GOOGLE_APPLICATION_CREDENTIALS(看起来here)。
我想知道是否还有其他选择,最好是免费的或具有很多免费访问权,才能进行这种图像读取并返回字符的位置?
我不需要OCR,我想返回图像中字符的位置
答案 0 :(得分:1)
ocr.space提供了一个不错的free ocr api。由于它“仅”是OCR API,因此使用起来比Google Cloud vision更容易。
以JSON格式返回字符的位置,
与该api相同。结果包含每个单词的边界框:
{
"ParsedResults" : [
{
"TextOverlay" : {
"Lines" : [
{
"Words": [
{
"WordText": "Word 1",
"Left": 106,
"Top": 91,
"Height": 9,
"Width": 11
},
{
"WordText": "Word 2",
"Left": 121,
"Top": 90,
"Height": 13,
"Width": 51
}