我的图片中的某些下划线非常接近文字。对于该特定文本,tesseract无法产生准确的结果。我附上了图片和文字文件。有什么方法可以提高文本的准确性吗?
我尝试使用某些图像处理技术删除下划线,但问题是那些接近文本的行不会被删除。
在tesseract中是否有任何参数可用于提高准确度?提前致谢。
image which i am trying to run
结果:
ARR!
d
1
\ OCIJHJO'LI' IJ“? 3 ..
10
电子。
F。
网站编号
考古学描述
一般网站描述网站覆盖着较大的针脚并且相对而言 良好的条件,下雪和EITTRE'SIGNS'OFTROSmN-EXCEPT-AEONG-Tmm _" - ""它的下降或在CREEK的FLOODPLAIN中有一些EEN动物的痕迹
过去在过去中出现了明显的情况。其中一个是安静的 “到了AUGER测试,但是已经填满了沙子并且再次长大。第一次AUGER测试
“进入这个DEE P" GULLY"
的真正深度是错误的印象SITE。这个测试孔产生了LIEHLQ所有方式都以42英寸的速度飞行 _m无菌沙地降至60英寸=静止场地生产的沙子和芯片仅限于 我是一个' A :: I L I i:'5!)这3 1.0 5.- 3 ..' Y __ 精细网站。 场地大小.AT L S - E Y考虑到MQBE 考古沉积的性质EAIBIEIHNDESTURBED沿着现场的边缘 T D0。 网站深度。 20-22英寸 隐 动物保护 花卉保鲜 人类遗骸 文化特征(类型和数量) 木炭保鲜 数据恢复方法 地表能见度:0%x 1-251 26-50%51-75%76-100%
地面覆盖物iMATURE PINE FOREST的描述
收集人数收集人数 表面收集方法的描述
测试和/或挖掘的类型和范围五个测试孔位于8"
的现场AUGERa这些已经在6"到达无菌粘土的水平已达到。 DIRTTA T- 从每个6"通过THROUGH_l / 4"
的电网和人工智能分析。所有测试孔都与DATUM MARKER有关的EIIE过渡 WHI是PIPE'_ - :fl' :3:0。 。 。:U' J I :::。 &#34!; uFF 3L 地面。 P __ \ l:我是:嗯\我' :我“我'我' .M'我' d' 。我是2! ti 0 .1。 ' - 。 _ .L l'
考古学成分
古印度晚期的道德兰世界17世纪
早期的古代密西西比18世纪
中世纪晚期史前19世纪
晚期古代未知的史前___20世纪__ 早期林地陶瓷史前____历史未知
中部林地16世纪