lseek()O(1)的复杂性?

时间:2014-02-09 11:16:19

标签: c linux time-complexity ext4 lseek

我知道我的问题在这里有一个答案:QFile seek performance。但我对答案并不完全满意。即使在查看了generic_file_llseek()对ext4的以下实现之后,我似乎也无法理解如何衡量复杂性。

/**
 * generic_file_llseek - generic llseek implementation for regular files
 * @file:       file structure to seek on
 * @offset:     file offset to seek to
 * @origin:     type of seek
 *
 * This is a generic implemenation of ->llseek useable for all normal local
 * filesystems.  It just updates the file offset to the value specified by
 * @offset and @origin under i_mutex.
 */
loff_t generic_file_llseek(struct file *file, loff_t offset, int origin)
{
        loff_t rval;

        mutex_lock(&file->f_dentry->d_inode->i_mutex);
        rval = generic_file_llseek_unlocked(file, offset, origin);
        mutex_unlock(&file->f_dentry->d_inode->i_mutex);

        return rval;
}

/**
 * generic_file_llseek_unlocked - lockless generic llseek implementation
 * @file:       file structure to seek on
 * @offset:     file offset to seek to
 * @origin:     type of seek
 *
 * Updates the file offset to the value specified by @offset and @origin.
 * Locking must be provided by the caller.
 */
loff_t
generic_file_llseek_unlocked(struct file *file, loff_t offset, int origin)
{
        struct inode *inode = file->f_mapping->host;

        switch (origin) {
        case SEEK_END:
                offset += inode->i_size;
                break;
        case SEEK_CUR:
                /*
                 * Here we special-case the lseek(fd, 0, SEEK_CUR)
                 * position-querying operation.  Avoid rewriting the "same"
                 * f_pos value back to the file because a concurrent read(),
                 * write() or lseek() might have altered it
                 */
                if (offset == 0)
                        return file->f_pos;
               break;
        }

        if (offset < 0 || offset > inode->i_sb->s_maxbytes)
                return -EINVAL;

        /* Special lock needed here? */
        if (offset != file->f_pos) {
                file->f_pos = offset;

                file->f_version = 0;
        }

        return offset;
}

比如说,我有一个4GB的文件,我知道文件中间部分的偏移量,lseek()如何在没有遍历整个文件的情况下让我到那里?操作系统是否已经知道文件的每个字节所在的位置?

3 个答案:

答案 0 :(得分:5)

lseek()中实现的

ext4只会递增文件指针并进行一些验证检查。它不依赖于文件大小,这意味着它是O(1)

你也可以在代码中看到这一点,那里没有任何循环或可疑的函数调用。

然而,虽然在ext4上也是如此,但对于其他文件系统可能不是这样,因为POSIX不保证这种行为。但除非文件系统用于非常特殊的目的,否则很可能。

答案 1 :(得分:1)

lseek的复杂性取决于系统中文件的表示形式。在大多数现代系统中,文件由一些聪明的树状数据结构组织,导致seek在时间O(logx(n))中执行,其中n是文件的大小,x是某个系统依赖数。

答案 2 :(得分:0)

是的,操作系统已经知道如何在文件中找到任何特定的字节。

不,不能保证是O(1)。您发布的代码是O(1),但其他文件系统的代码可能不是。

是的,它会足够快,除非操作系统或文件系统很糟糕。