我正在尝试编写我的第一个迭代器类/容器类型。基本上,我希望能够通过文件进行迭代,将文件转换为HEX,并将结果传递给boost :: xpressive库。我不想对RAM中的字符串进行一次性转换,因为我需要处理的一些文件大于预期的系统RAM(多GB)。
这是我的代码的样子。我正在使用MSVC ++ 2008。
Iterator的标题:
class hexFile;
class hexIterator : public std::iterator<std::bidirectional_iterator_tag, wchar_t>
{
hexFile *parent;
__int64 cacheCurrentFor;
wchar_t cacheCharacters[2];
void updateCache();
public:
bool highCharacter;
__int64 filePosition;
hexIterator();
hexIterator(hexFile *file, bool begin);
hexIterator operator++();
hexIterator operator++(int)
{
return ++(*this);
}
hexIterator operator--();
hexIterator operator--(int)
{
return --(*this);
}
bool operator==(const hexIterator& toCompare) const;
bool operator!=(const hexIterator& toCompare) const;
wchar_t& operator*();
wchar_t* operator->();
};
迭代器的实现:
#include <stdafx.h>
class hexFile;
hexIterator::hexIterator()
{
parent = NULL;
highCharacter = false;
filePosition = 0;
}
hexIterator::hexIterator(hexFile *file, bool begin) : parent(file)
{
if(begin)
{
filePosition = 0;
highCharacter = false;
} else
{
filePosition = parent->fileLength;
highCharacter = true;
}
}
hexIterator hexIterator::operator++()
{
if (highCharacter)
{
highCharacter = false;
filePosition++;
} else
{
highCharacter = true;
}
return (*this);
}
hexIterator hexIterator::operator--()
{
if (highCharacter)
{
highCharacter = false;
} else
{
filePosition--;
highCharacter = true;
}
return (*this);
}
bool hexIterator::operator==(const hexIterator& toCompare) const
{
if (toCompare.filePosition == filePosition &&
toCompare.highCharacter == highCharacter)
return true;
else return false;
}
bool hexIterator::operator!=(const hexIterator& toCompare) const
{
if (toCompare.filePosition == filePosition &&
toCompare.highCharacter == highCharacter)
return false;
else return true;
}
wchar_t& hexIterator::operator*()
{
updateCache();
if (highCharacter)
return cacheCharacters[1];
return cacheCharacters[0];
}
wchar_t* hexIterator::operator->()
{
updateCache();
if (highCharacter)
return cacheCharacters + 1;
return cacheCharacters;
}
void hexIterator::updateCache()
{
if (filePosition == cacheCurrentFor)
return;
BYTE rawData;
DWORD numberRead;
LONG lowValue = static_cast<LONG>(filePosition);
LONG highValue = static_cast<LONG>(filePosition >> 32);
SetFilePointer(parent->theFile, lowValue, &highValue, FILE_BEGIN);
if (!ReadFile(parent->theFile, &rawData, 1, &numberRead, 0))
throw std::runtime_error(eAsciiMsg("Error reading from file."));
static const wchar_t hexCharacters[] = L"0123456789ABCDEF";
cacheCharacters[0] = hexCharacters[rawData & 0x0F];
cacheCharacters[1] = hexCharacters[rawData >> 4];
cacheCurrentFor = filePosition;
}
容器标题
class hexFile {
public:
HANDLE theFile;
unsigned __int64 fileLength;
hexFile(const std::wstring& fileName)
{
theFile = CreateFile(fileName.c_str(),GENERIC_READ,FILE_SHARE_DELETE|FILE_SHARE_READ|FILE_SHARE_WRITE,NULL,OPEN_EXISTING,NULL,NULL);
if (theFile == INVALID_HANDLE_VALUE)
{
throw std::runtime_error(eAsciiMsg("Could not open file!"));
}
BY_HANDLE_FILE_INFORMATION sizeFinder;
GetFileInformationByHandle(theFile, &sizeFinder);
fileLength = sizeFinder.nFileSizeHigh;
fileLength <<= 32;
fileLength += sizeFinder.nFileSizeLow;
};
~hexFile()
{
CloseHandle(theFile);
};
hexIterator begin()
{
hexIterator theIterator(this, true);
return theIterator;
};
hexIterator end()
{
hexIterator theIterator(this, false);
return theIterator;
};
};
然而,无论我尝试什么测试用例,正则表达式都不匹配。我假设它是我的迭代器的一些概念问题..它应该是所有情况下的常量双向迭代器。
我缺少什么,或者有更简单的方法吗?
Billy3
答案 0 :(得分:1)
operator++(int)
应根据operator++()
定义,而不是相反。尝试切换它们。与operator--
相同。
答案 1 :(得分:1)
这是需要阅读的相当多的代码;乍一看,我什么也没看到。
对于实现说明,这听起来像是一个iostream而不是迭代器,它可以显着加快缓冲。 Boost有一个库来帮助实现those。
如果你想使用迭代器,他们也有library来帮助你,它确保你获得所需的所有方法,同时简化实现。
为了调试,我尝试进行单元测试;应该有希望指出问题;从一个小的东西开始,比如一个有两个字符的文件,在调试器中查看发生了什么,然后迭代直到你传递所有内容。
答案 2 :(得分:1)
好吧......结果我是一个完全白痴。
boost :: xpressive :: regex_match(fileInstance.begin(),fileInstance.end(),results,internalRegex);
嗯......我打算做的是
boost :: xpressive :: regex _search (fileInstance.begin(),fileInstance.end(),results,internalRegex);
迭代器从未出现过问题。
抱歉浪费别人的时间, Billy3
答案 3 :(得分:0)