有人可以帮我创建一个函数,使用pathlib
库创建某个目录下所有文件的列表吗?
在这里,我有一个:
我有
c:\desktop\test\A\A.txt
c:\desktop\test\B\B_1\B.txt
c:\desktop\test\123.txt
我希望有一个列表可以包含上面的路径,但我的代码会返回一个嵌套列表。
这是我的代码:
from pathlib import Path
def searching_all_files(directory: Path):
file_list = [] # A list for storing files existing in directories
for x in directory.iterdir():
if x.is_file():
file_list.append(x)
else:
file_list.append(searching_all_files(directory/x))
return file_list
p = Path('C:\\Users\\akrio\\Desktop\\Test')
print(searching_all_files(p))
希望有人能纠正我。
答案 0 :(得分:17)
使用glob列出所有文件和目录。然后过滤它。
p = Path('C:\\Users\\akrio\\Desktop\\Test').glob('**/*')
files = [x for x in p if x.is_file()]
答案 1 :(得分:12)
from pathlib import Path
from pprint import pprint
def searching_all_files(directory):
dirpath = Path(directory)
assert(dirpath.is_dir())
file_list = []
for x in dirpath.iterdir():
if x.is_file():
file_list.append(x)
elif x.is_dir():
file_list.extend(searching_all_files(x))
return file_list
pprint(searching_all_files('.'))
答案 2 :(得分:4)
您可以使用os.listdir()。它将为您提供目录中的所有内容 - 文件和目录。
如果您只想要文件,可以使用os.path:
对其进行过滤from os import listdir
from os.path import isfile, join
onlyfiles = [files for files in listdir(mypath) if isfile(join(mypath, files))]
或者您可以使用os.walk(),它会为它访问的每个目录生成两个列表 - 为您分割成文件和目录。如果你只想要顶级目录,你可以在它第一次产生时中断
from os import walk
files = []
for (dirpath, dirnames, filenames) in walk(mypath):
files.extend(filenames)
break
答案 3 :(得分:2)
晚些时候参加聚会,但是可以通过使用内置的Python filter
函数来实现与@prasastoadi类似的,更面向功能的解决方案
>>> my_path = Path(r'C:\Users\akrio\Desktop\Test')
>>> list(filter(Path.is_file, my_path.glob('**/*')))
答案 4 :(得分:1)
def searching_all_files(directory: Path):
file_list = [] # A list for storing files existing in directories
for x in directory.iterdir():
if x.is_file():
file_list.append(x)#here should be appended
else:
file_list.extend(searching_all_files(directory/x))# need to be extended
return file_list
答案 5 :(得分:1)
如果文件的后缀相同,例如.txt
,则可以使用rglob
递归列出主目录和所有子目录。
paths = list(Path(INPUT_PATH).rglob('*.txt'))
如果您需要对每个路径应用任何有用的Path function。例如,访问name
属性:
[k.name for k in Path(INPUT_PATH).rglob('*.txt')]
INPUT_PATH
是主目录的路径,Path
是从pathlib
导入的。
答案 6 :(得分:1)
如果您可以假设仅文件对象的名称(例如.txt,.png等)中带有.
,则可以进行全局或递归全局搜索...
from pathlib import Path
# Search the directory
list(Path('testDir').glob('*.*'))
# Search directories and subdirectories, recursively
list(Path('testDir').rglob('*.*'))
但并非总是如此。有时存在诸如.ipynb_checkpoints
之类的隐藏目录和不带扩展名的文件。在这种情况下,请使用列表理解或过滤器来整理路径文件。
# Search Single Directory
list(filter(lambda x: x.is_file(), Path('testDir').iterdir()))
# Search Directories Recursively
list(filter(lambda x: x.is_file(), Path('testDir').rglob('*')))
# Search Single Directory
[x for x in Path('testDir').iterdir() if x.is_file()]
# Search Directories Recursively
[x for x in Path('testDir').rglob('*') if x.is_file()]
答案 7 :(得分:0)
使用pathlib2更容易,
<button id="gs-address-go" class="b-btn bold go-btn" onclick="$('#splash-get-walkscore-form').submit(); return false;" aria-label="Go"><span class="icon big-search"></span></button>
答案 8 :(得分:0)
使用 pathlib,就像下面的命令一样简单。
path = Path('C:\\Users\\akrio\\Desktop\\Test')
list(path.iterdir())
答案 9 :(得分:-1)
import os
import pathlib
def get_all_files(dir_path_to_search):
filename_list = []
with os.scandir(dir_path_to_search) as entries:
for entry in entries:
if entry.is_file():
# print(entry.name)
filename_list.append(entry.name)
return filename_list
dir_path_to_search= pathlib.Path("C:\\Users\\akrio\\Desktop\\Test")
print(get_all_files(dir_path_to_search))