我试图找出Rust的一些基本内容。
我想创建一个从文件中读取512个字节的工具,并将这些字节复制到另一个文件中。然后从输入文件中取出接下来的8个字节并跳过它们。然后从输入文件中取下一个512字节,然后将它们复制到输出文件,然后跳过8个字节,等等......
我需要这个工具快速,所以我不能每512字节执行一次I / O调用。我想我首先需要读取几兆字节的输入文件,然后通过有选择地将其复制到另一个内存块来删除内存中不需要的8字节块,然后调用I / O写入来转储更大的内存马上阻止。
所以,我想做这样的事情(伪代码):
let buffer = buffer of 'u8' of size 4MB;
let buffer_out = buffer of 'u8' of size 4MB;
// both buffers above take 8MB of memory
let input_stream = InputStream(buffer);
let output_stream = OutputStream(buffer_out);
for(every 4MB block in the input file) {
input.read(buffer); // read the 4MB block into 'buffer'
input_stream.seek(0); // reset the input stream's cursor to offset 0
for(every 520 byte inside the 4MB block in 'buffer') {
output_stream.write(input_stream.read(512)); // copy important 512 bytes
input_stream.read(8); // skip superfluous 8 bytes
}
output.write(buffer_out);
}
Rust中的问题是我尝试使用Cursor
对象来实现对两个缓冲区的流式访问。例如,我在堆上分配缓冲区,如下所示:
let mut buf: Box<[u8; BUF_SIZE]> = Box::new([0; BUF_SIZE]);
然后我创建了一个Cursor来以流模式访问这个数组:
let mut rd_cursor: Cursor<&[u8]> = Cursor::new(buf.as_slice());
但是,我现在不知道如何从输入文件中读取数据。 buf
使用了Cursor
,因此我无法访问它。在C ++中,我只是将数据读取到buf
并完成它。并且Cursor
似乎没有实现BufReader.read()
可以直接使用的任何内容,我用它来从输入文件中读取数据。
也许我可以通过创建另一个缓冲区,从&#39;输入&#39;读取数据来使其工作。到临时缓冲区,从临时缓冲区到&#39; buf&#39;通过光标,但这将导致不断重新复制内存,我想避免。
我可以看到fill_buf
中有Cursor
函数,但它似乎只返回对底层缓冲区的只读引用,因此我无法修改缓冲区,因此它&# 39;对我来说没用。
我还尝试使用BufReader
代替Cursor
。这是我的第二次尝试:
let mut rd_cursor: BufReader<&[u8]> = BufReader::new(&*buf);
BufReader<R>
包含get_mut
返回R
,所以我认为它应该在我的情况下返回&[u8]
,这听起来是件好事。但是,使用&[u8]
,get_mut
抱怨我需要传递一个可变的内容R
。所以我改变它是这样的:
let mut rd_cursor: BufReader<&mut [u8]> = BufReader::new(&mut *buf);
但是Rust不会让我:
src\main.rs|88 col 47| 88:61 error: the trait `std::io::Read` is not implemented for the type `[u8]` [E0277]
|| src\main.rs:88 let mut rd_cursor: BufReader<&mut [u8]> = BufReader::new(&mut *buf);
有人可以打我的头脑来解决我对这里发生的事情的理解吗?
答案 0 :(得分:3)
BufReader
已经缓冲读取。引用文档:
包装一个Read并从中缓冲输入
直接使用Read实例可能效率过低。例如,每次调用TcpStream都会导致系统调用。 BufReader对底层Read执行大量不经常的读取,并维护结果的内存缓冲区。
您可以简单地将容量设置为几兆字节,然后处理512 + 8字节读取周期。当你用完缓冲区时,BufReader
只会进行实际的系统调用。
以下错误
错误:未对类型
实施特性std::io::Read
[E0277][u8]
是因为生锈并不知道你想要多少字节。 [u8]
是一个未经过大小处理的数组。我不确定你是否可以&mut [u8, BUF_SIZE]
但是你需要这些东西