简单地分配值时的内存分配错误

时间:2018-05-22 20:43:48

标签: c++ unicode mfc tchar

我有以下代码,以便从给定路径获取父目录。 注意: size_t unsigned int typedef

/****************************************************
This function takes a full path to a file, and returns
the directory path by returning the string up to the last backslash.

Author: Aashish Bharadwaj
*****************************************************/
_TCHAR* GetDirectoryFromPath(const _TCHAR* path)
{
   size_t size = _tcslen(path);
   size_t lastBackslash = 0;
   for (size_t i = 0; i < size; i++)
   {
      if (path[i] == '\\')
      {
         lastBackslash = i;
      }
   }

   _TCHAR* dirPath = new _TCHAR();
   size_t i;
   for (i = 0; i <= lastBackslash; i++)
   {
      dirPath[i] = path[i];
   }
   dirPath[i + 1] = '\0';  //THIS IS VERY NECESSARY! Otherwise, a bunch of garbage is appended to the character array sometimes.

   return dirPath;
}

问题是有时它会附加一个奇怪的&#34; @&#34;将符号查找到它返回的字符串的末尾。enter image description here

我想知道是否有人知道这是什么以及为什么会这样做。

1 个答案:

答案 0 :(得分:4)

问题是您正在分配仅1 TCHAR,然后您正在写入已分配的内存块的末尾。您的代码有未定义的行为

您需要使用new _TCHAR[...]代替new _TCHAR()

您也没有处理没有找到反斜杠的情况。在这种情况下,即使第一个字符不是反斜杠,lastBackslash也是0。你没有检查这种可能性。因为你的循环使用的是<=而不是<,所以当它不应该是第一个字符时,它将最终复制。

尝试更像这样的东西:

const size_t c_invalid_index = (size_t) -1;

_TCHAR* GetDirectoryFromPath(const _TCHAR* path)
{
    size_t lastBackslash = c_invalid_index;

    size_t size = _tcslen(path);
    for (size_t i = 0; i < size; ++i)
    {
        if (path[i] == _T('\\'))
        {
            lastBackslash = i;
        }
    }

    if (lastBackslash == c_invalid_index)
        return NULL;

    _TCHAR* dirPath = new _TCHAR[lastBackslash + 2];
    for (size_t i = 0; i <= lastBackslash; ++i)
    {
        dirPath[i] = path[i];
    }
    dirPath[lastBackslash + 1] = _T('\0');

    return dirPath;
}

可替换地:

_TCHAR* GetDirectoryFromPath(const _TCHAR* path)
{
    const _TCHAR *lastBackslash = NULL;

    size_t size = _tcslen(path);
    for (size_t i = 0; i < size; ++i)
    {
        if (path[i] == _T('\\'))
        {
            lastBackslash = &path[i];
        }
    }

    if (!lastBackslash)
        return NULL;

    size = (lastBackslash - path) + 1;

    _TCHAR* dirPath = new _TCHAR[size + 1];
    for (size_t i = 0; i < size; ++i)
    {
        dirPath[i] = path[i];
    }
    dirPath[size] = _T('\0');

    return dirPath;
}

话虽如此,你真的不应该使用像这样的原始字符串指针。使用std::basic_string<_TCHAR>(如果不是std::stringstd::wstring,或者在{+ 1}}或std::u16string在C ++ 11及更高版本中使用会更安全,更清晰,例如:

std::u32string