我正在基于sbull创建一个非常简单的块RAM磁盘。
到目前为止,如果我使用dd读取/写入数据块,它工作正常,但每当我尝试在其上安装文件系统(有时创建文件系统)时,我的驱动程序崩溃。
经过长时间的调试,我终于发现了什么是错的,即使我找不到解决问题的方法。因此我的问题在这里:))
每当用户空间应用程序使用OF OF OFFSET向设备创建请求时,驱动程序将无法工作!让我向您展示源代码以澄清:
首先,我正在使用mk_request处理请求(不使用request_queue):
static void escsi_mk_request(struct request_queue *q, struct bio *bio)
{
struct block_device *bdev = bio->bi_bdev;
struct escsi_dev *esd = bdev->bd_disk->private_data;
int rw;
struct bio_vec *bvec;
sector_t sector;
int i;
int err = -EIO;
printk("request received nr. sectors = %lu\n",bio_sectors(bio));
sector = bio->bi_sector;
if (bio_end_sector(bio) > get_capacity(bdev->bd_disk))
goto out;
if (unlikely(bio->bi_rw & REQ_DISCARD)) {
err = 0;
goto out;
}
rw = bio_rw(bio);
if (rw == READA)
rw = READ;
bio_for_each_segment(bvec, bio, i) {
unsigned int len = bvec->bv_len;
err = esd_do_bvec(esd, bvec->bv_page, len, bvec->bv_offset, rw, sector);
if (err) {
printk("err!\n");
break;
}
sector += len >> SECTOR_SHIFT;
}
out:
bio_endio(bio, err);
}
esd_do_bvec函数:
static int esd_do_bvec(struct escsi_dev *esd, struct page *page,
unsigned int len, unsigned int off, int rw,
sector_t sector)
{
void *mem;
int err = 0;
unsigned int offset;
int i;
offset = off + sector * 512;
printk("ESD RW=%d, len=%d, off=%d, offset=%d, sector=%lu\n",rw,len,off,offset,sector);
mem = kmap_atomic(page);
if (rw == READ) {
memcpy(mem,esd->data+offset,len);
} else {
memcpy(esd->data+offset,mem,len);
}
kunmap_atomic(mem);
out:
return err;
}
好的,所以基本上当我使用dd读取或写入数据时,esd_do_bvec()中的变量“off”始终为0,无论我想写入多少字节和多少字节。文件系统显然总是以4KB块的形式执行I / O,即使只需要替换一个字节,也会写一个完整的块。
我确信没有偏移时读写操作正常,因为我创建了一个与块RAM磁盘大小相同的文件,并使用dd将整个文件转储到我的设备中,然后得到了设备的输出(也使用dd),输入和输出文件完全相同。我还将同一个文件写入了一个brd(Linux内核原始块RAM磁盘驱动程序),输出与我的设备和brd设备相同。
但是 - 在某些特定情况下,我尝试在我的设备上安装或创建一个新文件系统,并以某种方式获取带有偏移量的I / O请求,此时我的驱动程序失败。我假设我没有正确处理偏移。例如,当我尝试“mount -t ext2 / dev / esda”时:
linux-xjwl:/home/phil/escsi # mount /dev/esda -t ext2 /mnt/esda1/
mount: wrong fs type, bad option, bad superblock on /dev/esda,
missing codepage or helper program, or other error
In some cases useful info is found in syslog - try
dmesg | tail or so
linux-xjwl:/home/phil/escsi # dmesg|tail -n 10
[ 2239.275901] ESD RW=0, len=4096, off=0, offset=16384, sector=32
[ 2239.275947] request received nr. sectors = 8
[ 2239.275959] ESD RW=0, len=4096, off=0, offset=4096, sector=8
[ 2239.276516] request received nr. sectors = 8
[ 2239.276537] ESD RW=0, len=4096, off=0, offset=2097152, sector=4096
[ 2239.276606] request received nr. sectors = 8
[ 2239.276626] ESD RW=0, len=4096, off=0, offset=28672, sector=56
[ 2239.277535] request received nr. sectors = 2
[ 2239.277535] ESD RW=0, len=1024, off=1024, offset=2048, sector=2
[ 2239.277535] EXT4-fs (esda): VFS: Can't find ext4 filesystem
(p.s。:输出显示“EXT4”,但我使用“-t ext2”运行)
我检查了扇区n的内容。 2在我的设备中它确实包含ext2元数据(因为我在尝试安装之前运行了mkfs.ext2,当然)。所以我认为偏移存在问题。到目前为止,我无法真正调试我的驱动程序,因为我无法提出一个请求会导致带有偏移量的I / O请求(例如,如果我尝试将单个字节写入我的设备,Linux将会读取整个块并用一个不同的字节重写它。)
希望这对你来说不是一个简单的问题。
提前致谢, 菲尔
请参阅下面的Peter提供的答案。
如果你想知道esd_do_bvec()函数现在是什么样子,那就来了:
static int esd_do_bvec(struct escsi_dev *esd, char *buf,
unsigned int len, int rw, sector_t sector)
{
int err = 0;
unsigned int offset;
// Please notice that we STILL have an offset to deal with, but
// this offset comes in sectors and needs to be converted to a
// a byte offset.
offset = sector << SECTOR_SHIFT; // or multiply by 512
//printk("ESD RW=%d, len=%d, off=%d, offset=%d, sector=%lu\n",rw,len,off,offset,sector);
if (rw == READ) {
memcpy(buf,esd->data+offset,len);
} else {
memcpy(esd->data+offset,buf,len);
}
return err;
}
答案 0 :(得分:4)
每个段的偏移量不是指块设备位置的偏移量,而是指页面中的偏移量。要使其非零,您可能需要编写自己的运行read()
和write()
的C程序。分配页面对齐的缓冲区,然后读取/写入该缓冲区中的不同位置,这些缓冲区应显示为bvec中的偏移量。
也就是说,LWN警告手动管理此页面偏移,并建议在bio_kmap_irq()
变量bio_for_each_segment()
上调用宏bio
,并处理原子kmap并管理偏移条目。资料来源:http://lwn.net/Articles/26404/
您的代码将类似于:
bio_for_each_segment(bvec, bio, i) {
unsigned int len = bvec->bv_len;
unsigned long flags;
char *buf = bio_kmap_irq(bio, &flags);
err = esd_do_bvec(esd, buf, len, rw, sector);
bio_kunmap_irq(buf, &flags);
if (err) {
printk("err!\n");
break;
}
sector += len >> SECTOR_SHIFT;
}
当然这会改变esd_do_bvec
的签名,直接接受内存缓冲区而不是页面/偏移量。