我正在开发一个项目,它会在一个非常紧凑的循环中生成大量的连续文本字符串。我的应用程序在程序的其他部分大量使用SIMD指令集扩展,如SSE和MMX,但密钥生成器是普通的C ++。
我的密钥生成器的工作方式是我有一个keyGenerator类,它包含一个存储当前密钥的char数组。要获取下一个键,有一个名为“incrementKey”的函数,它将字符串视为一个数字,在字符串中添加一个,并在必要时携带。
现在问题是,keygen有点瓶颈。这很快,但如果速度更快就会很好。最大的问题之一是当我使用我的SSE2代码生成一组要处理的顺序键时,我必须将整个集存储在一个数组中,这意味着我必须顺序生成并将12个字符串复制到一个数组中。数组,一个接一个,像这样:
char* keys[12];
for(int i = 0; i < 12; i++)
{
keys[i] = new char[16];
strcpy(keys[i], keygen++);
}
那么你将如何有效地生成这些明文字符串呢?我需要一些想法来帮助实现这一目标。并发会很好;因为我的代码现在是,每个连续的密钥取决于前一个密钥,这意味着处理器无法在下一个密钥开始工作,直到完全生成当前密钥。
以下是与密钥生成器相关的代码:
KeyGenerator.h
class keyGenerator
{
public:
keyGenerator(unsigned long long location, characterSet* charset)
: location(location), charset(charset)
{
for(int i = 0; i < 16; i++)
key[i] = 0;
charsetStr = charset->getCharsetStr();
integerToKey();
}
~keyGenerator()
{
}
inline void incrementKey()
{
register size_t keyLength = strlen(key);
for(register char* place = key; place; place++)
{
if(*place == charset->maxChar)
{
// Overflow, reset char at place
*place = charset->minChar;
if(!*(place+1))
{
// Carry, no space, insert char
*(place+1) = charset->minChar;
++keyLength;
break;
}
else
{
continue;
}
}
else
{
// Space available, increment char at place
if(*place == charset->charSecEnd[0]) *place = charset->charSecBegin[0];
else if(*place == charset->charSecEnd[1]) *place = charset->charSecBegin[1];
(*place)++;
break;
}
}
}
inline char* operator++() // Pre-increment
{
incrementKey();
return key;
}
inline char* operator++(int) // Post-increment
{
memcpy(postIncrementRetval, key, 16);
incrementKey();
return postIncrementRetval;
}
void integerToKey()
{
register unsigned long long num = location;
if(!num)
{
key[0] = charsetStr[0];
}
else
{
num++;
while(num)
{
num--;
unsigned int remainder = num % charset->length;
num /= charset->length;
key[strlen(key)] = charsetStr[remainder];
}
}
}
inline unsigned long long keyToInteger()
{
// TODO
return 0;
}
inline char* getKey()
{
return key;
}
private:
unsigned long long location;
characterSet* charset;
std::string charsetStr;
char key[16];
// We need a place to store the key for the post increment operation.
char postIncrementRetval[16];
};
CharacterSet.h
struct characterSet
{
characterSet()
{
}
characterSet(unsigned int len, int min, int max, int charsec0, int charsec1, int charsec2, int charsec3)
{
init(length, min, max, charsec0, charsec1, charsec2, charsec3);
}
void init(unsigned int len, int min, int max, int charsec0, int charsec1, int charsec2, int charsec3)
{
length = len;
minChar = min;
maxChar = max;
charSecEnd[0] = charsec0;
charSecBegin[0] = charsec1;
charSecEnd[1] = charsec2;
charSecBegin[1] = charsec3;
}
std::string getCharsetStr()
{
std::string retval;
for(int chr = minChar; chr != maxChar; chr++)
{
for(int i = 0; i < 2; i++) if(chr == charSecEnd[i]) chr = charSecBegin[i];
retval += chr;
}
return retval;
}
int minChar, maxChar;
// charSec = character set section
int charSecEnd[2], charSecBegin[2];
unsigned int length;
};
答案 0 :(得分:1)
嗯..性能方面,所有新的/ strcpy / strmp可能比你的keygen更伤害你。
一次在较大的池中分配内存,然后在其中使用指针。
使用keygen,您应该避免坚持生成的单个密钥的泄漏抽象,而是一次生成最佳数量。可能更大的倍数。
在某些时间间隔内,您实际上可以使用SSE / MMX来生成密钥,至少在字符串对齐时可以被SSE / MMX字长整除。您也可以尝试用0填充它,然后如果字符串没有将它们移开。如果你一次只生成16个,那么这可能并不值得。