如何使用Python计算目录中的文件数

时间:2010-04-13 18:38:38

标签: python count glob fnmatch

我需要使用Python计算目录中的文件数。

我想最简单的方法是len(glob.glob('*')),但这也将目录本身视为文件。

有没有办法只计算目录中的文件

26 个答案:

答案 0 :(得分:204)

os.listdir()比使用glob.glob稍微有效一点。要测试文件名是普通文件(而不是目录或其他实体),请使用os.path.isfile()

import os, os.path

# simple version for working with CWD
print len([name for name in os.listdir('.') if os.path.isfile(name)])

# path joining version for other paths
DIR = '/tmp'
print len([name for name in os.listdir(DIR) if os.path.isfile(os.path.join(DIR, name))])

答案 1 :(得分:70)

import os

path, dirs, files = next(os.walk("/usr/lib"))
file_count = len(files)

答案 2 :(得分:37)

对于所有类型的文件,包括子目录:

import os

list = os.listdir(dir) # dir is your directory path
number_files = len(list)
print number_files

仅文件(避免子目录):

import os

onlyfiles = next(os.walk(dir))[2] #dir is your directory path as string
print len(onlyfiles)

答案 3 :(得分:29)

这就是fnmatch非常方便的地方:

import fnmatch

print len(fnmatch.filter(os.listdir(dirpath), '*.txt'))

更多详情:http://docs.python.org/2/library/fnmatch.html

答案 4 :(得分:12)

import os
print len(os.listdir(os.getcwd()))

答案 5 :(得分:11)

def directory(path,extension):
  list_dir = []
  list_dir = os.listdir(path)
  count = 0
  for file in list_dir:
    if file.endswith(extension): # eg: '.txt'
      count += 1
  return count

答案 6 :(得分:7)

这使用os.listdir并适用于任何目录:

import os
directory = 'mydirpath'

number_of_files = len([item for item in os.listdir(directory) if os.path.isfile(os.path.join(directory, item))])

这可以通过生成器进行简化,并且可以通过以下方式加快:

import os
isfile = os.path.isfile
join = os.path.join

directory = 'mydirpath'
number_of_files = sum(1 for item in os.listdir(directory) if isfile(join(directory, item)))

答案 7 :(得分:7)

我很惊讶没有人提到os.scandir

def count_files(dir):
    return len([1 for x in list(os.scandir(dir)) if x.is_file()])

答案 8 :(得分:6)

如果要计算目录中的所有文件 - 包括子目录中的文件,最pythonic方式是:

import os

file_count = sum(len(files) for _, _, files in os.walk(r'C:\Dropbox'))
print(file_count)

我们使用比明确添加文件计数(正在等待的时间)

更快的总和

答案 9 :(得分:4)

def count_em(valid_path):
   x = 0
   for root, dirs, files in os.walk(valid_path):
       for f in files:
            x = x+1
print "There are", x, "files in this directory."
return x

来自this post

答案 10 :(得分:4)

import os

def count_files(in_directory):
    joiner= (in_directory + os.path.sep).__add__
    return sum(
        os.path.isfile(filename)
        for filename
        in map(joiner, os.listdir(in_directory))
    )

>>> count_files("/usr/lib")
1797
>>> len(os.listdir("/usr/lib"))
2049

答案 11 :(得分:3)

这是一个简单的单行命令,我发现它很有用:

print int(os.popen("ls | wc -l").read())

答案 12 :(得分:3)

使用pathlib并且没有将整个列表加载到内存的答案:

from pathlib import Path

path = Path('.')

print(sum(1 for _ in path.glob('*')))  # Files and folders, not recursive
print(sum(1 for _ in path.glob('**/*')))  # Files and folders, recursive

print(sum(1 for x in path.glob('*') if x.is_file()))  # Only files, not recursive
print(sum(1 for x in path.glob('**/*') if x.is_file()))  # Only files, recursive

答案 13 :(得分:3)

卢克的代码重新格式化。

import os

print len(os.walk('/usr/lib').next()[2])

答案 14 :(得分:1)

我发现另一个答案可能是正确的答案。

for root, dirs, files in os.walk(input_path):    
for name in files:
    if os.path.splitext(name)[1] == '.TXT' or os.path.splitext(name)[1] == '.txt':
        datafiles.append(os.path.join(root,name)) 


print len(files) 

答案 15 :(得分:1)

如果您正在使用操作系统的标准shell,您可以更快地获得结果,而不是使用纯粹的pythonic方式。

Windows示例:

import os
import subprocess

def get_num_files(path):
    cmd = 'DIR \"%s\" /A-D /B /S | FIND /C /V ""' % path
    return int(subprocess.check_output(cmd, shell=True))

答案 16 :(得分:1)

import os

total_con=os.listdir('<directory path>')

files=[]

for f_n in total_con:
   if os.path.isfile(f_n):
     files.append(f_n)


print len(files)

答案 17 :(得分:1)

一个衬里和递归:

def count_files(path):
    return sum([len(files) for _, _, files in os.walk(path)])

count_files('path/to/dir')

答案 18 :(得分:1)

这是一个简单的解决方案,它计算包含子文件夹的目录中文件的数量。它可能会派上用场;

import os
from pathlib import Path

def count_files(rootdir):
    '''counts the number of files in each subfolder in a directory'''
    for path in pathlib.Path(rootdir).iterdir():
        if path.is_dir():
            print("There are " + str(len([name for name in os.listdir(path) \
            if os.path.isfile(os.path.join(path, name))])) + " files in " + \
            str(path.name))
            
 
count_files(data_dir) # data_dir is the directory you want files counted.

您应该获得与此类似的输出(当然,占位符已更改);

There are {number of files} files in {name of sub-folder1}
There are {number of files} files in {name of sub-folder2}

答案 19 :(得分:0)

我使用glob.iglob作为类似于

的目录结构
data
└───train
│   └───subfolder1
│   |   │   file111.png
│   |   │   file112.png
│   |   │   ...
│   |
│   └───subfolder2
│       │   file121.png
│       │   file122.png
│       │   ...
└───test
    │   file221.png
    │   file222.png

以下两个选项都返回4(正如预期的那样,即不计算子文件夹本身

  • len(list(glob.iglob("data/train/*/*.png", recursive=True)))
  • sum(1 for i in glob.iglob("data/train/*/*.png"))

答案 20 :(得分:0)

我做了这个,这返回了文件夹中的文件数(Attack_Data)......这样可以正常工作。

import os
def fcount(path):
    #Counts the number of files in a directory
    count = 0
    for f in os.listdir(path):
        if os.path.isfile(os.path.join(path, f)):
            count += 1

    return count
path = r"C:\Users\EE EKORO\Desktop\Attack_Data" #Read files in folder
print (fcount(path))

答案 21 :(得分:0)

很简单:

,catalog="databasename"

它只是计算目录中的文件数,我使用列表理解技术来遍历特定目录,以返回所有文件。 “ len(返回列表)”返回文件数。

答案 22 :(得分:0)

虽然我同意@DanielStutzbach提供的答案:os.listdir()的效率要比使用glob.glob的效率高。

但是,如果要计算文件夹中特定文件的数量,则需要额外的精度,因此您想使用len(glob.glob())。例如,如果您要计算要使用的文件夹中的所有pdf,则:

pdfCounter = len(glob.glob1(myPath,"*.pdf"))

答案 23 :(得分:0)

我通过将自己定向到目录文件夹中,通过Google Colab计算了Google驱动器目录中的Google驱动器目录中的文件数时,解决了该问题

import os                                                                                                
%cd /content/drive/My Drive/  
print(len([x for x in os.listdir('folder_name/']))  

普通用户可以尝试

 import os                                                                                                     
 cd Desktop/Maheep/                                                     
 print(len([x for x in os.listdir('folder_name/']))  

答案 24 :(得分:0)

简短

import os
directory_path = '/home/xyz/'
No_of_files = len(os.listdir(directory_path))

答案 25 :(得分:0)

我编写了一个简单的实用程序函数,它使用os.scandir()而不是os.listdir()

import os 

def count_files_in_dir(path: str) -> int:
    file_entries = [entry for entry in os.scandir(path) if entry.is_file()]

    return len(file_entries)

主要优点在于,消除了对os.path.is_file()的需求,并替换为os.DirEntry实例的is_file(),这也消除了对os.path.join(DIR, file_name)的需求,如其他答案所示。