PDF在视觉线上分裂

时间:2015-03-11 13:03:23

标签: pdf ocr edit batch-processing

我需要以下问题的信息:

上下文:我有很多歌曲的环绕文件夹。文件夹中的歌曲数量导致纸张中的铃声降级。如果我有另一个环形文件夹但是我现在处于2的数量,这将解决,如果我需要带他们,任何更多将是一个麻烦。

我打算将所有页面扫描为PDF。 (希望花费最多的时间)。页面的格式如图所示。你总是拥有一首带有和弦的歌曲的编号(现在作为标题显示)。当一首歌结束时,当它转到下一首歌时会有一条黑线。像这样,我们每页有2列。

example image

目标:我想要每首歌曲1 pdf,前缀为XXX.pdf,其中XXX为数字。是的,目前有超过700首歌曲。

我需要什么:

  1. 在中间黑线上拆分PDF
  2. 连接拆分PDF(多个PDF,因为歌曲可以在不同的PDF上打印)
  3. 在水平线上拆分以使用正确的编号
  4. 分隔PDF
  5. (可选:)整理PDF以便它们非常直接
  6. 我已经找到了能够使用OCR批处理但没有找到能够在视觉线上分割的程序。这就是我想为自己/开源社区编写代码的原因。所以我是一名程序员,我知道 OCR 存在,但我完全没有经验。我不知道从哪里开始寻找或使用哪种编程语言。任何帮助表示赞赏。

    ...

    我将开始扫描我的页面......

0 个答案:

没有答案