比较最后的字符,不区分大小写(带谓词?)

时间:2017-07-19 23:59:28

标签: c++ string std stdstring wstring

我有一个std::wstring fName文件名,我想测试,如果它有.txt扩展名。这有效:

return ((fName.length() >= 4) && (0 == fName.compare(fName.length() - 4, 4, L".txt")));

但它区分大小写,我不想要:我需要blah.tXthello.TXT才能被接受。

这应该作为不区分大小写的版本:

std::wstring ext = L".txt";
wstring::const_iterator it = std::search(fName.end() - 4, fName.end(), ext.begin(), ext.end(), 
                               [](wchar_t ch1, wchar_t ch2) { return tolower(ch1) == ch2; }); 
                    // no need tolower(ch2) because the pattern .txt is already lowercase
return (it != str1.end());

std::search可能远非最佳,因为它会搜索包含模式(原始字符串中的任何位置),而这里我只需要比较逐字符。

由于我需要对数百万个文件名进行测试,如何提高性能以检查文件名是否有扩展名(不区分大小写).txt

我不想要简单的解决方案:

  • 让新变量中的fName小写(或者甚至是fName的最后4个字符的小写)

  • 然后比较

因为这需要新的变量,内存等。我可以将到位与自定义谓词[](wchar_t ch1, wchar_t ch2) { return tolower(ch1) == ch2; })进行比较吗?

注意:我没有寻找Boost解决方案,也没有寻找像Case insensitive string comparison in C++这样的解决方案或许多未针对性能进行优化的类似问题。

4 个答案:

答案 0 :(得分:0)

这个怎么样?

#include <string>
#include <algorithm>

template<typename CharT>
bool HasExtension(const std::basic_string<CharT>& fileName, const std::basic_string<CharT>& ext)
{
    auto b = fileName.begin() + fileName.length() - ext.length();
    auto a = ext.begin();

    while (b != fileName.end())
    {
        if (*a++ != tolower(*b++))
        {
             return false;
        }
    }
    return true;
}


int  main()
{
    std::string ext{".Txt"}; // make sure this is a lower case std::string.
    std::transform(ext.begin(), ext.end(), ext.begin(), tolower);  

    std::string fn{"test.txt"};

   return HasExtension(fn, ext) ? 0 : 1;
}

答案 1 :(得分:0)

建议的解决方案是

#include <iostream>
#include <string>

bool isTXT(const std::wstring& str)
{
    std::wstring::size_type idx;
    idx = str.rfind('.');
    if( idx != std::wstring::npos ){
        std::wstring ext = str.substr(idx+1);
        if( ext == L"txt" || ext == L"TXT" ) // do all possible combinations.
            return true;
    }
    return false;
}

int main()
{
    std::wstring fileName = L"haihs.TXT";
    std::wcout << isTXT(fileName) << std::endl;

    return 0;
}

对于条件语句ext == L"txt" || ext == L"TXT",如果您不想创建wstring以将其转换为大写或大写,则可以填写其余内容。

答案 2 :(得分:0)

正如@ fghj的评论所述,这是一个很好的解决方案:

std::equal(fName.end() - ext.length(), fName.end(), ext.begin(),
           [](wchar_t ch1, wchar_t ch2) { return tolower(ch1) == ch2; });

答案 3 :(得分:-2)

如果您想要一个没有假设的实现(也不假设扩展的长度,但假设文件的名称大小至少为4个字符):

char * testing = &fName[fName.length() - 4];
unsigned int index = 1;
unsigned int total = 0;
while(index < 4) {
    total += testing[index] << index;
    ++index;
}
return total == ('t' << 1) + ('x' << 2) + ('t' << 3) || total == ('T' << 1) + ('X' << 2) + ('T' << 3);

这是非常优化的,但假设其他扩展名的ASCII值之和与.txt扩展名的ascii值之和不匹配(我还假设扩展名将有3个字符,就像你做的那样以上):

int index = fName.length();
int total = fName[--index] + fName[--index] + fName[--index];
return total == 't' + 'x' + 't' || 'T' + 'X' + 'T';

这是上面所说的更复杂的版本,但应该更快:

return *((int*)&fName[index - 4]) == '.' + 't' + 'x' + 't';

如果您知道其他任何扩展都不以“t”结尾,中间有“x”等等,您可以进一步优化这一点:

return fName[fName.length() - 1] == 't' || 'T;