系统地注释PDF

时间:2019-04-11 19:38:11

标签: java python excel pdf

我有一个大型的PDF文件,其中包含数百页。 PDF的每一页都包含一个图表,还包含一个唯一的标识符(图表编号)。

我对每个图表都有各自的评论,并希望将其插入相应的PDF页面,例如图表注释34进入包含图表34的PDF页面。

我目前的方法是使用Adobe Acrobat Pro中的注释工具,手动地逐一插入这些注释。您需要想象的时间。

有没有办法加快这一过程?理想情况下,我会将所有注释保存在电子表格(不太理想的是Python)中,旁边是图表代码。然后,将注释写入PDF。

有什么想法可以做到吗?

1 个答案:

答案 0 :(得分:0)

您可以将PDF转换为文本文件,保存,导入并搜索“注释”吗?我不确定逻辑将是什么,并且您没有在此处发布任何代码,但是下面的代码将遍历文本文件并查找字符串的所有事件,我们将其称为“测试”和“应用程序” '。

Sub ReadFile()
Open "C:\Users\rshuell001\Desktop\sample.txt" For Input As #1
lRow = 1

Do While Not EOF(1)
    Line Input #1, Data
    Data = Application.WorksheetFunction.Trim(Data)
sData = Split(Data, " ")

    With Sheet1
        lColumn = 1
        For intCount = LBound(sData) To UBound(sData)
            .Cells(lRow, lColumn) = sData(intCount)
            lColumn = lColumn + 1
        Next intCount
    End With
    lRow = lRow + 1

Loop

Close #1

Call CopyOver

End Sub

Sub CopyOver()

Dim Rng As Range, cell As Range
Dim rw As Long
Set Rng = Worksheets("Sheet1").Range("B1:B20")
rw = 1
For Each cell In Rng

If Left(cell.Value, 4) = "test" Then
    If Left(cell.Value, 4) = "test" And cell.Offset(0, -1) = "application:" Then
    GoTo ExitPoint
    Else
    Worksheets("Sheet2").Cells(rw, "A") = cell.Value
    Worksheets("Sheet2").Cells(rw + 1, "A") = cell.Offset(1, 0)
    Worksheets("Sheet2").Cells(rw + 2, "A") = cell.Offset(3, 0)
    Worksheets("Sheet2").Cells(rw + 2, "B") = cell.Offset(3, 1)
ExitPoint:
    rw = rw + 2
    End If
End If
Next


End Sub

之前:

enter image description here

之后:

enter image description here