需要帮助解决警告:取消引用类型化指针会破坏严格的别名规则

时间:2019-05-04 12:11:37

标签: c pointers gcc casting strict-aliasing

我正在研究一组C代码以对其进行优化。修复损坏的代码时,我遇到了警告。

环境为Linux,C99,使用-Wall -O2标志进行编译。

最初,结构文本是这样定义的:

    struct text {
        char count[2];
        char head[5];
        char textdata[5];
    }

代码将返回指针T1T2到预期的headtextdata字符串:

int main(void) {
    struct text *T1;
    char *T2;
    char data[] = "02abcdeabcde";

    T1 = (struct text *)data;
    T2 = T1->textdata;
    gettextptr((char *)T1, T2);
    printf("\nT1 = %s\nT2 = %s\n", (char *)T1, T2);
    return (0);
}

void gettextptr(char *T1, char *T2) {
    struct text *p;
    int count;

    p = (struct text *)T1;
    count = (p->count[0] - '0') * 10 + (p->count[1] - '0');

    while (count--) {
        if (memcmp(T2, T1, 2) == 0) {
            T1 += 2;
            T2 += 2;
        }
    }
}

这没有按预期工作。期望返回第一个“ c”和最后一个“ e”的地址。通过GDB,我发现,一旦执行指针从gettextptr()返回到父函数,它就不会保留T1T2的地址。然后我尝试了使用双指针的另一种“通过引用调用”的方法:

int main(void) {
    struct text *T1;
    char *T2;
    char data[] = "02abcdeabcde";

    T1 = (struct text *)data;
    T2 = T1->textdata;
    gettextptr((char **)&T1, &T2);
    printf("\nT1 = %s\nT2 = %s\n", (char *)T1, T2);
    return (0);
}

void gettextptr(char **T1, char **T2) {
    struct text *p;
    int count;

    p = (struct text *)(*T1);
    count = (p->count[0] - '0') * 10 + (p->count[1] - '0');

    while (count--) {
        if (memcmp(*T2, *T1, 2) == 0) {
            *T1 += 2;
            *T2 += 2;
        }
    }
}

当我使用-Wall -O2编译此代码时,收到以下GCC警告:

 pointer.c: In function ‘main’:
 pointer.c:23: warning: dereferencing type-punned pointer will break strict-aliasing rules

所以:

  1. 代码在第一种情况下是按值调用的吗?

  2. 在严格遵守别名规则的情况下,是否不允许(char **)进行强制转换?

  3. 要解决此警告,我缺少什么?

1 个答案:

答案 0 :(得分:1)

严格的别名规则是paragraph 6.5/7 of the Standard。它说的基本上是,您只能通过兼容类型的左值访问对象,可能还需要附加限定符。相应的有符号/无符号类型;数组,结构或联合类型,成员之间是其中之一,或者是字符类型。您收到的诊断信息表明您的代码多次违反该规则。

您很早就遇到麻烦:

    T1 = (struct text *)data;

该转换是允许的,尽管不能保证所得到的指针正确对齐,但是在不违反严格的别名规则的情况下,您可以使用T1进行很多操作。特别是,如果您使用*->取消引用(实际上这是您要做的下一件事),则您将访问char数组,就好像它是一个{{ 1}}。这是不允许的,尽管相反的情况会有所不同。

将您转换为struct textT1并通过该指针访问指向数组的方法,就像您稍后要做的那样。

char *是相同的(两个版本)。它执行与上述相同的转换,并在访问gettextexpr()时取消对转换后的指针的引用。产生的行为违反了严格的别名规则,因此未定义。然而,在第二种情况下,GCC真正抱怨的是,当它实际上是p->count时,就好像访问*T1一样访问char *,这是另一个单独的严格别名违反。

因此,针对您的具体问题:

  
      
  1. 代码在第一种情况下是按值调用的吗?
  2.   

C仅按值传递 ,所以可以。在第一种情况下,您按值传递了两个struct text *指针,然后可以使用它们来修改调用者的char数据。在第二种情况下,您按值传递了两个char指针,您可以并且确实使用它们来修改调用者的char *变量。

  
      
  1. 在保留严格的别名规则的同时,是否不允许(char **)进行强制转换?
  2.   

不,绝对不是。将转换为{em> char *(不是char *)可以使您通过结果指针访问对象的表示形式,因为解引用char **会产生字符类型的左值,但是没有类型可以在没有严格混叠含义的情况下从转换而来。

  
      
  1. 要解决此警告,我缺少什么?
  2.   

您错过了您试图做的事情从根本上被禁止了的消息。 C不允许访问char *数组,就好像它是一个char期。尽管如此,编译器可能会接受这样做的代码,但是其行为是不确定的。

通过放弃“强制转换为结构”方法来解决警告,该方法始终仅提供语法糖的撒粉。摆脱所有强制转换并编写代码实际上更简单明了:

struct text

要清除所有的强制转换 count = ((*T1)[0] - '0') * 10 + ((*T1)[1] - '0'); 也许仍然更清楚:

sscanf

还请注意,即使允许使用,您的特定访问模式似乎也会对结构成员的布局进行假设,而该结构成员的语言并不合理。实现可能在成员之间以及最后一个成员之后使用任意填充,并且您的代码无法容纳该填充。