我有一个块设备驱动程序,它在商业产品中工作了一年多。最近,我尝试通过启用丢弃和使用REQ_DISCARD
标志处理请求来添加对精简配置的支持。每当我针对来自任何上下文的这些类型的请求调用blk_end_request
的任何变体时,我似乎至少获得BUG()
输出,并且最坏的情况下挂起或哎呀(变体包括blk_end_request_all
和解锁版本以__
为前缀。此外,当我尝试以这种方式完成请求时(对于正常的读/写请求工作正常),上面的文件系统驱动程序ext4有时甚至使用相同的请求指针重新发出相同的REQ_DISCARD
请求。这是一个简化的请求函数(传递给blk_init_queue
),它演示了这个问题。这是我可以转换请求的时间,因此它几乎消除了我的所有代码,这些代码再次适用于正常的读/写。
// This is a simplified version of the function that's passed into blk_init_queue
static void
my_request_fn(struct request_queue * queue)
{
struct request * req;
while ((req = blk_fetch_request(queue)) != NULL) {
if (rq_data_dir(req) && (req->cmd_flags & REQ_DISCARD)) {
printk(KERN_INFO "Received DISCARD request from process %d, sector=%lu, req %p\n",
pid_nr(task_pid(current)),
blk_rq_pos(req),
req);
// FIXME: this is a lie
__blk_end_request_all(req, 0);
continue;
}
// ... more code hidden for brevity
}
}
这些请求是否需要从根本上区别对待?我试着查看其他驱动程序,例如sd,md,xenblk等......但它们完全不同,所以还不清楚。我想基本问题是你如何正确处理REQ_DISCARD请求并通知/发出完成信号?
如果这是一个已知错误,uname -a报告的内核版本为Linux mydevbox 3.2.0-54-generic #82-Ubuntu SMP Tue Sep 10 20:08:42 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux
答案 0 :(得分:2)
我发布在这里因为我的智慧结束了。解决方案很简单,这可能会帮助其他遇到同样问题的人。 discard
功能存在新的限制。其中两个在下面。
// WARNING: these values are bad, do not use
queue->limits.discard_zeroes_data = 1;
queue->limits.max_discard_sectors = 1;
queue->limits.discard_granularity = 2048;
我以某种方式转换了最后两个值,因此丢弃粒度非常大,最大扇区只有1.在注释掉第三行(这应该只是一个提示)并修复第二行的RHS值一切正常!值如下所示。
queue->limits.discard_zeroes_data = 1;
queue->limits.max_discard_sectors = 2048
// queue->limits.discard_granularity = 1;
如果您在处理REQ_DISCARDED请求时遇到间歇性崩溃和BUG()
堆栈跟踪,请仔细检查您的配置。