我的网页上有一个简单的图片 OCR 文字。
我想通过 Tesseract.js 获取此图片的文字。它在第一次发布时工作正常。将显示以下消息,仅此而已:
初始化api(100%)
重装后工作正常。我不知道为什么它只在重新加载页面后才起作用。如果我清除缓存,问题会重新出现。我用的是Firefox。
我的HTML / Javascript文件
<html>
<head>
<title>QRScanner Library Test</title>
<script src="tesseract.js"></script>
</head>
<body>
<input type="button" id="go_button" value="Run" />
<div id="ocr_results"> </div>
<div id="ocr_status"> </div>
<img id="img" src="ocr.gif"/>
<script>
document.getElementById("go_button")
.addEventListener("click", function(e) {
var url = document.getElementById("img").src;
runOCR(url);
});
function runOCR(url) {
Tesseract.recognize(url)
.then(function(result) {
document.getElementById("ocr_results")
.innerText = result.text;
}).progress(function(result) {
document.getElementById("ocr_status")
.innerText = result["status"] + " (" +
(result["progress"] * 100) + "%)";
});
}
</script>
</body>
</html>
我已在同一文件夹中下载了所有js文件:tesseract.js
,worker.js
,index.js
和语言包eng.traineddata.gz