PDF示例:" Smith#00 $ Consolidated_Performance.pdf"
目标是根据文件名为每个PDF的第1页添加书签。
(示例中的书签名称为" Consolidated Performance")
import os
from openpyxl import load_workbook
from PyPDF2 import PdfFileMerger
cdir = "Directory of PDF" # Current directory
pdfcdir = [filename for filename in os.listdir(cdir) if filename.endswith(".pdf")]
def addbookmark(f):
output = PdfFileMerger()
name = os.path.splitext(os.path.basename(f))[0] # Split filename from .pdf extension
dp = name.index("$") + 1 # Find position of $ sign
bookmarkname = name[dp:].replace("_", " ") # replace underscores with spaces
output.addBookmark(bookmarkname, 0, parent=None) # Add bookmark
output.append(open(f, 'rb'))
output.write(open(f, 'wb'))
for f in pdfcdir:
addbookmark(f)
UDF在应用于单个PDF时工作正常,但是当放入代码底部的循环时,它不会添加书签。关于如何使UDF循环遍历pdfcdir中的所有PDF的任何想法?
答案 0 :(得分:0)
我很确定你所遇到的问题与循环无关。相反,您只传递文件名而不包括目录路径。它试图在脚本的当前工作目录(脚本所在的目录,默认情况下)中打开这些文件,而不是在您从中读取文件名的目录中。
因此,在调用函数时,请使用每个文件名加入目录名称。
for f in pdfcdir:
addbookmark(os.path.join(cdir, f))