获取pathlib对象的字符串表示形式

时间:2018-08-14 18:07:46

标签: python-3.x pdf pathlib

我正在编写一个python脚本,将多个PDF合并为一个以放入输出文件夹。每个PDF都将位于不同的文件夹中,上面带有员工名称,并且需要与另一个文件夹中的相应pdf合并。并非所有员工都有每个文件,因此我将其包含在逻辑中。

我目前遇到的问题是,PdfFileMerger在附加文件时需要一个字符串,而pathlib库返回一个windowpath对象。那将不容易转换为字符串。我从这篇帖子pypdf Merging multiple pdf files into one pdf中获得了有关PyPDF2的信息。我是pathlib库的新手,应该进行转换还是应该获取其他路径对象?

from PyPDF2 import PdfFileMerger, PdfFileReader
from pathlib import Path

tc = Path('totalcomp')
merger = PdfFileMerger()


for i in tc.iterdir():
pdfs = []
try:
    pdfs.append(Path(f'profitshare/{i.name}'))
    pdfs.append(Path(f'merit/{i.name}'))
finally:
    pdfs.append(i)
    for pdf in pdfs:
        output = i.name
        merger.append(pdf, 'rb')
    merger.write(Path(f'/output/{i.name}'))

1 个答案:

答案 0 :(得分:0)

根据pathlib documentation

路径的字符串表示形式是原始文件系统路径本身(本机格式,例如Windows下的反斜杠),您可以将其传递给将文件路径作为字符串的任何函数:

>>> p = PurePath('/etc')
>>> str(p)
'/etc'
>>> p = PureWindowsPath('c:/Program Files')
>>> str(p)
'c:\\Program Files'

所以解决方案是使用Path()函数包装str()个对象:

from PyPDF2 import PdfFileMerger, PdfFileReader
from pathlib import Path

tc = Path('totalcomp')
merger = PdfFileMerger()


for i in tc.iterdir():
pdfs = []
try:
    pdfs.append(str(Path(f'profitshare/{i.name}')))
    pdfs.append(str(Path(f'merit/{i.name}')))
finally:
    pdfs.append(i)
    for pdf in pdfs:
        output = i.name
        merger.append(pdf, 'rb')
    merger.write(str(Path(f'/output/{i.name}')))

顺便说一句,还有另一种pathlib的方法,该方法以字符串形式返回路径:as_posix()

使用正斜杠(/)返回路径的字符串表示形式:

>>>
>>> p = PureWindowsPath('c:\\windows')
>>> str(p)
'c:\\windows'
>>> p.as_posix()
'c:/windows'