标签: pdf pdf-scraping
我正在编制一组记录。将纸质记录转换为PDF然后转换为文本并不是一个大问题。我面临的主要问题与表格中的手写条目有关。
pdf都是手写的表格副本。有些区域似乎不是一个需要提取的问题(即手写X在一个盒子里),但其他区域似乎更难。虽然如果其他人有这样做的有效方法,请告诉我。
有没有办法将手写转换为Unicode然后提取它?