Linux块设备驱动程序:如何处理REQ_DISCARD

时间:2013-10-20 21:18:44

标签: c linux kernel block-device

我有一个块设备驱动程序,它在商业产品中工作了一年多。最近,我尝试通过启用丢弃和使用REQ_DISCARD标志处理请求来添加对精简配置的支持。每当我针对来自任何上下文的这些类型的请求调用blk_end_request的任何变体时,我似乎至少获得BUG()输出,并且最坏的情况下挂起或哎呀(变体包括blk_end_request_all和解锁版本以__为前缀。此外,当我尝试以这种方式完成请求时(对于正常的读/写请求工作正常),上面的文件系统驱动程序ext4有时甚至使用相同的请求指针重新发出相同的REQ_DISCARD请求。这是一个简化的请求函数(传递给blk_init_queue),它演示了这个问题。这是我可以转换请求的时间,因此它几乎消除了我的所有代码,这些代码再次适用于正常的读/写。

// This is a simplified version of the function that's passed into blk_init_queue
static void
my_request_fn(struct request_queue * queue)
{
    struct request * req;

    while ((req = blk_fetch_request(queue)) != NULL) {

        if (rq_data_dir(req) && (req->cmd_flags & REQ_DISCARD)) {
            printk(KERN_INFO "Received DISCARD request from process %d, sector=%lu, req %p\n",
                   pid_nr(task_pid(current)),
                   blk_rq_pos(req),
                   req);
            // FIXME: this is a lie
            __blk_end_request_all(req, 0);
            continue;
        }

// ... more code hidden for brevity
    }
}

这些请求是否需要从根本上区别对待?我试着查看其他驱动程序,例如sd,md,xenblk等......但它们完全不同,所以还不清楚。我想基本问题是你如何正确处理REQ_DISCARD请求并通知/发出完成信号?

如果这是一个已知错误,uname -a报告的内核版本为Linux mydevbox 3.2.0-54-generic #82-Ubuntu SMP Tue Sep 10 20:08:42 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux

1 个答案:

答案 0 :(得分:2)

我发布在这里因为我的智慧结束了。解决方案很简单,这可能会帮助其他遇到同样问题的人。 discard功能存在新的限制。其中两个在下面。

// WARNING: these values are bad, do not use
queue->limits.discard_zeroes_data = 1;
queue->limits.max_discard_sectors = 1;
queue->limits.discard_granularity = 2048;

我以某种方式转换了最后两个值,因此丢弃粒度非常大,最大扇区只有1.在注释掉第三行(这应该只是一个提示)并修复第二行的RHS值一切正常!值如下所示。

queue->limits.discard_zeroes_data = 1;
queue->limits.max_discard_sectors = 2048
// queue->limits.discard_granularity = 1;

如果您在处理REQ_DISCARDED请求时遇到间歇性崩溃和BUG()堆栈跟踪,请仔细检查您的配置。