从 pdf 文件扫描数据矩阵代码并将它们保存到 csv

时间:2021-06-10 13:58:01

标签: python-3.x csv pdf gs1-datamatrix

任务: 从 pdf 文件扫描数据矩阵代码并将它们保存到 csv。

<块引用>

File

最终结果: 010466010514027621)ZPTsFWoUgqe,91009492ZCUruNv8/rQRlZyH/mZhkRY11D5aW4aLjpVn3DVxFIi7l9gV/pvguWxiVnpTRI0SFkNjiw==6SFkNjiw==

我无法在脑海中形成这段代码的结构。

我开始研究用于处理 pdf 文件的库,特别是 PyPDF2,但遇到了一个问题。 PyPDF2 在文件中绝对找不到任何内容。我试图在pdf文件的代码中找到序列,但什么都不明白。

请帮助我处理此代码的任何部分(写入 csv 除外)。 可以从 PDF 中提取信息而无需渲染成图像,因为大量代码和代码速度起着重要作用。

如果有人知道pdf的结构,请告诉我是否可以绘制出datamatrix代码的每个像素(黑色方块)的位置,是否可以将所有这些转换为最终形式.

如果您提供任何信息,我将不胜感激。谢谢。

0 个答案:

没有答案