删除完整磁盘上的旧文件

时间:2012-03-22 02:35:04

标签: python wrapper

以100MB块的形式将数据写入磁盘的应用程序,并通过附加+1来增加文件名,因此n1, n2 ... n1000。这最终使用分区上的所有可用空间(Linux主机)。我正在寻找一种方法来删除系列中首次写入的文件,直到驱动器空间处于特定利用率之下。

如果是后者,https://stackoverflow.com/a/5912404/666891会是一个好的解决方案吗?

提出了以下解决方案,并且看起来是https://stackoverflow.com/a/837840/666891的可行解决方案。如何修改这个以处理增量文件扩展名,因为当前脚本运行时它不会删除文件名filename *,星号是递增的数字,从最旧的数字开始?

import os
def free_space_up_to(free_bytes_required="161061273600", rootfolder="/data/", ex
tension="filename-*"):
    file_list= files_to_delete(rootfolder, extension)
    while file_list:
        statv= os.statvfs(rootfolder)
        if statv.f_bfree*statv.f_bsize >= free_bytes_required:
            break
        os.remove(file_list.pop())

1 个答案:

答案 0 :(得分:3)

好吧,如果您知道所有文件(至少是那种)的大小为100MB,并且假设没有其他任何东西可以彻底改变计算机上的磁盘使用情况,则无需在每次迭代时检查可用空间。 / p>

此外,如果所有文件具有相同的名称,除了最后的计数器之外,您可以跳过os.stat调用(对于快速连续创建的文件也可能没用)并根据计数器对文件名进行排序:

import os

def free_space_up_to(free_bytes_required=161061273600, rootfolder="/data/", filesize=104857600, basename="filename-"):
    '''Deletes rootfolder/basename*, oldest first, until there are free_bytes_required available on the partition.
    Assumes that all files have file_size, and are all named basename{0,1,2,3,...}
    Returns number of deleted files.
    '''
    statv = os.statvfs(rootfolder)
    required_space = free_bytes_required - statv.f_bfree*statv.f_bsize
    basepath = os.path.join(rootfolder, basename)
    baselen = len(basepath)
    if required_space <= 0:
        return 0

    # "1 +" here for quickly rounding
    files_to_delete = 1 + required_space/filesize

    # List all matching files. If needed, replace with os.walk for recursively
    # searching into subdirectories of rootfolder
    file_list = [os.path.join(rootfolder, f) for f in os.listdir(rootfolder)
                 if f.startswith(basename)]

    file_list.sort(key=lambda i: int(i[baselen:]), reverse=True)
    # Alternatively, if the filenames can't be trusted, sort based on modification time
    #file_list.sort(key=lambda i: os.stat(i).st_mtime)

    for f in file_list[:files_to_delete]:
        os.remove(f)
    return files_to_delete

(未经过彻底测试,我建议用“打印”代替“os.remove”进行测试;))