我正在研究一组C代码以对其进行优化。修复损坏的代码时,我遇到了警告。
环境为Linux,C99,使用-Wall -O2
标志进行编译。
最初,结构文本是这样定义的:
struct text {
char count[2];
char head[5];
char textdata[5];
}
代码将返回指针T1
和T2
到预期的head
和textdata
字符串:
int main(void) {
struct text *T1;
char *T2;
char data[] = "02abcdeabcde";
T1 = (struct text *)data;
T2 = T1->textdata;
gettextptr((char *)T1, T2);
printf("\nT1 = %s\nT2 = %s\n", (char *)T1, T2);
return (0);
}
void gettextptr(char *T1, char *T2) {
struct text *p;
int count;
p = (struct text *)T1;
count = (p->count[0] - '0') * 10 + (p->count[1] - '0');
while (count--) {
if (memcmp(T2, T1, 2) == 0) {
T1 += 2;
T2 += 2;
}
}
}
这没有按预期工作。期望返回第一个“ c”和最后一个“ e”的地址。通过GDB,我发现,一旦执行指针从gettextptr()
返回到父函数,它就不会保留T1
和T2
的地址。然后我尝试了使用双指针的另一种“通过引用调用”的方法:
int main(void) {
struct text *T1;
char *T2;
char data[] = "02abcdeabcde";
T1 = (struct text *)data;
T2 = T1->textdata;
gettextptr((char **)&T1, &T2);
printf("\nT1 = %s\nT2 = %s\n", (char *)T1, T2);
return (0);
}
void gettextptr(char **T1, char **T2) {
struct text *p;
int count;
p = (struct text *)(*T1);
count = (p->count[0] - '0') * 10 + (p->count[1] - '0');
while (count--) {
if (memcmp(*T2, *T1, 2) == 0) {
*T1 += 2;
*T2 += 2;
}
}
}
当我使用-Wall -O2
编译此代码时,收到以下GCC警告:
pointer.c: In function ‘main’:
pointer.c:23: warning: dereferencing type-punned pointer will break strict-aliasing rules
所以:
代码在第一种情况下是按值调用的吗?
在严格遵守别名规则的情况下,是否不允许(char **)
进行强制转换?
要解决此警告,我缺少什么?
答案 0 :(得分:1)
严格的别名规则是paragraph 6.5/7 of the Standard。它说的基本上是,您只能通过兼容类型的左值访问对象,可能还需要附加限定符。相应的有符号/无符号类型;数组,结构或联合类型,成员之间是其中之一,或者是字符类型。您收到的诊断信息表明您的代码多次违反该规则。
您很早就遇到麻烦:
T1 = (struct text *)data;
该转换是允许的,尽管不能保证所得到的指针正确对齐,但是在不违反严格的别名规则的情况下,您可以使用T1
进行很多操作。特别是,如果您使用*
或->
取消引用(实际上这是您要做的下一件事),则您将访问char
数组,就好像它是一个{{ 1}}。这是不允许的,尽管相反的情况会有所不同。
将您转换为struct text
到T1
并通过该指针访问指向数组的方法,就像您稍后要做的那样。
char *
是相同的(两个版本)。它执行与上述相同的转换,并在访问gettextexpr()
时取消对转换后的指针的引用。产生的行为违反了严格的别名规则,因此未定义。然而,在第二种情况下,GCC真正抱怨的是,当它实际上是p->count
时,就好像访问*T1
一样访问char *
,这是另一个单独的严格别名违反。
因此,针对您的具体问题:
- 代码在第一种情况下是按值调用的吗?
C仅按值传递 ,所以可以。在第一种情况下,您按值传递了两个struct text *
指针,然后可以使用它们来修改调用者的char
数据。在第二种情况下,您按值传递了两个char
指针,您可以并且确实使用它们来修改调用者的char *
变量。
- 在保留严格的别名规则的同时,是否不允许(char **)进行强制转换?
不,绝对不是。将转换为{em> char *
(不是char *
)可以使您通过结果指针访问对象的表示形式,因为解引用char **
会产生字符类型的左值,但是没有类型可以在没有严格混叠含义的情况下从从转换而来。
- 要解决此警告,我缺少什么?
您错过了您试图做的事情从根本上被禁止了的消息。 C不允许访问char *
数组,就好像它是一个char
期。尽管如此,编译器可能会接受这样做的代码,但是其行为是不确定的。
通过放弃“强制转换为结构”方法来解决警告,该方法始终仅提供语法糖的撒粉。摆脱所有强制转换并编写代码实际上更简单明了:
struct text
要清除所有的强制转换 count = ((*T1)[0] - '0') * 10 + ((*T1)[1] - '0');
也许仍然更清楚:
sscanf
还请注意,即使允许使用,您的特定访问模式似乎也会对结构成员的布局进行假设,而该结构成员的语言并不合理。实现可能在成员之间以及最后一个成员之后使用任意填充,并且您的代码无法容纳该填充。