如何使用boost从mmap&#d文件中读取异构二进制数据?

时间:2016-05-13 15:08:32

标签: c++ boost ifstream mmap

我已经构建了一个小测试应用程序,使用boost::iostreams::mapped_file_source从文件中读取二进制数据。

不幸的是我没有把垃圾拿出来 - 所以显然没有正确读取数据。

我的假设是我可以将data()指针投射到我期望的任何类型,但我认为这是不正确的。

const char* data = file.data();
uint64_t f1 = (uint64_t)*data;  // incorrect

证明:

我使用std::ifstream构建了另一个测试应用来验证数据,并且按预期工作。

问题:

如何从boost::iostreams::mapped_file_source读取异构二进制数据?

示例:

工作ifstream和损坏的boost测试应用程序都在下面。

使用std::ifstream阅读二进制数据的工作示例:

#include <iostream>
#include <fstream>

template<typename T>
void read(std::ifstream& ifs, T& data)
{
    ifs.read(reinterpret_cast<char*>(&data), sizeof(T));
}

int main()
{
    std::ifstream ifs("/tmp/data", std::ios::in | std::ios::binary);

    uint64_t f1;
    int32_t  f2
    double   f3;

    while(1)
    {
        read(ifs, f1);
        read(ifs, f2);
        read(ifs, f3);

        if (ifs.eof())
            break;

        std::cout << f1 << ' ' << f2 << ' ' << f3 << '\n';
    }
    return 0;
}

输出(正确):

1463071170459690752 400 90.08
1463071170504337152 400 90.08
1463071170561888256 300 90.08
1463071170561923328 400 90.08
1463071170561973760 500 90.08

使用boost::iostreams::mapped_file_source读取二进制数据的破碎示例:

#include <boost/iostreams/device/mapped_file.hpp>
#include <iostream>

int main()
{
    boost::iostreams::mapped_file_source file;
    file.open("/tmp/data");

    int         size = file.size();
    const char* data = file.data();

    uint64_t    f1;
    int32_t     f2
    double      f3;

    while (size > 0)
    {
        f1 = (uint64_t)*data; data += sizeof(uint64_t); size -= sizeof(uint64_t);
        f2 = (int32_t)*data;  data += sizeof(int32_t);  size -= sizeof(int32_t);
        f3 = (double)*data;   data += sizeof(double);   size -= sizeof(double);

        std::cout << f1 << ' ' << f2 << ' ' << f3 << '\n';
    }
    return 0;
}

输出(不正确):

0 -112 -123
0 -112 -123
0 44 -123
0 -112 -123
0 -12 -123

1 个答案:

答案 0 :(得分:2)

您的转换错误。我会举一个例子,你可以解决其余问题。

f1 = (uint64_t)*data;

这解除引用char* - 给你一个1字节的值 - 而不是将这个单字节值转换为64位int!绝对不是你想做的。相反,你需要这个:

f1 = *(uint64_t*)data;

由于我确实更喜欢明确,但更好的是,

f1 = *reinterpret_cast<uint64_t*>(data);