我有一个程序,os.walk
是一个目录及其子目录,用于过滤pdf文件,分离出它们的名称和相应的路径名。我遇到的问题是它将扫描最顶层的目录并打印相应的文件名,例如G:/Books/Title.Pdf
但第二次扫描子文件夹,例如G:/Books/Sub Folder/Title.pdf
,它将打印以下内容
G:/Books/Sub Folder\\Title.Pdf
(显然是无效的路径名)。它还会将\\添加到子文件夹中的任何子文件夹。
以下是程序:
def dicitonary_list():
indexlist=[] #holds all files in the given directory including subfolders
pdf_filenames=[] #holds list of all pdf filenames in indexlist
pdf_dir_list = [] #holds path names to indvidual pdf files
for root, dirs,files in os.walk('G:/Books/'):
for name in files:
indexlist.append(root + name)
if ".pdf" in name[-5:]:
pdf_filenames.append(name)
for files in indexlist:
if ".pdf" in files[-5:]:
pdf_dir_list.append(files)
dictionary=dict(zip(pdf_filenames, pdf_dir_list)) #maps the pdf names to their directory address
我知道这是一件我想念的简单事情,但是对于爱情和金钱我都能看到它是什么。一双新鲜的眼睛会有很大帮助!
答案 0 :(得分:7)
正斜杠和反斜杠都是Windows上Python中完全有效的路径分隔符。
>>> import os
>>> os.getcwd()
'j:\\RpmV'
>>> os.path.exists('j:\\Rpmv\\make.py')
True
>>> os.path.exists('j:/rpmv/make.py')
True
>>> os.path.isfile('j:\\Rpmv/make.py')
True