将UDF应用到for循环中 - Python

时间:2017-03-28 21:49:33

标签: python pdf pypdf2

PDF示例:" Smith#00 $ Consolidated_Performance.pdf"

目标是根据文件名为每个PDF的第1页添加书签。

(示例中的书签名称为" Consolidated Performance")

import os
from openpyxl import load_workbook
from PyPDF2 import PdfFileMerger

cdir = "Directory of PDF" # Current directory
pdfcdir = [filename for filename in os.listdir(cdir) if filename.endswith(".pdf")]

def addbookmark(f):
    output = PdfFileMerger()
    name = os.path.splitext(os.path.basename(f))[0] # Split filename from .pdf extension
    dp = name.index("$") + 1 # Find position of $ sign
    bookmarkname = name[dp:].replace("_", " ") # replace underscores with spaces
    output.addBookmark(bookmarkname, 0, parent=None) # Add bookmark
    output.append(open(f, 'rb'))
    output.write(open(f, 'wb'))

for f in pdfcdir:
    addbookmark(f)

UDF在应用于单个PDF时工作正常,但是当放入代码底部的循环时,它不会添加书签。关于如何使UDF循环遍历pdfcdir中的所有PDF的任何想法?

1 个答案:

答案 0 :(得分:0)

我很确定你所遇到的问题与循环无关。相反,您只传递文件名而不包括目录路径。它试图在脚本的当前工作目录(脚本所在的目录,默认情况下)中打开这些文件,而不是在您从中读取文件名的目录中。

因此,在调用函数时,请使用每个文件名加入目录名称。

for f in pdfcdir:
    addbookmark(os.path.join(cdir, f))