我有一个大型的PDF文件,其中包含数百页。 PDF的每一页都包含一个图表,还包含一个唯一的标识符(图表编号)。
我对每个图表都有各自的评论,并希望将其插入相应的PDF页面,例如图表注释34进入包含图表34的PDF页面。
我目前的方法是使用Adobe Acrobat Pro中的注释工具,手动地逐一插入这些注释。您需要想象的时间。
有没有办法加快这一过程?理想情况下,我会将所有注释保存在电子表格(不太理想的是Python)中,旁边是图表代码。然后,将注释写入PDF。
有什么想法可以做到吗?
答案 0 :(得分:0)
您可以将PDF转换为文本文件,保存,导入并搜索“注释”吗?我不确定逻辑将是什么,并且您没有在此处发布任何代码,但是下面的代码将遍历文本文件并查找字符串的所有事件,我们将其称为“测试”和“应用程序” '。
Sub ReadFile()
Open "C:\Users\rshuell001\Desktop\sample.txt" For Input As #1
lRow = 1
Do While Not EOF(1)
Line Input #1, Data
Data = Application.WorksheetFunction.Trim(Data)
sData = Split(Data, " ")
With Sheet1
lColumn = 1
For intCount = LBound(sData) To UBound(sData)
.Cells(lRow, lColumn) = sData(intCount)
lColumn = lColumn + 1
Next intCount
End With
lRow = lRow + 1
Loop
Close #1
Call CopyOver
End Sub
Sub CopyOver()
Dim Rng As Range, cell As Range
Dim rw As Long
Set Rng = Worksheets("Sheet1").Range("B1:B20")
rw = 1
For Each cell In Rng
If Left(cell.Value, 4) = "test" Then
If Left(cell.Value, 4) = "test" And cell.Offset(0, -1) = "application:" Then
GoTo ExitPoint
Else
Worksheets("Sheet2").Cells(rw, "A") = cell.Value
Worksheets("Sheet2").Cells(rw + 1, "A") = cell.Offset(1, 0)
Worksheets("Sheet2").Cells(rw + 2, "A") = cell.Offset(3, 0)
Worksheets("Sheet2").Cells(rw + 2, "B") = cell.Offset(3, 1)
ExitPoint:
rw = rw + 2
End If
End If
Next
End Sub
之前:
之后: