我正在尝试从this image中提取文字。这就是我的尝试:
install.packages("tesseract")
library(tesseract)
text4 <- ocr("goodmorning .jpg")
cat(text4)
这是我得到的输出:
祷告有什么好处? 给出最佳答案 作者:Swami Vivekanand: “我一无所获, 事实上我失去了愤怒, 抑郁症,嫉妒, 刺激&amp;不安全“。
输出没有提取“早安”。我也需要提取早安。你能指点我怎样才能提取早安文本?
P.S。我不确定,但我认为“早安”已经通过电话在图片的屏幕截图中进行了编辑。这可能是 ocr 未检测到字符串的原因。