人们通常将“不可修改的”与术语“
”联系起来char* str = "Hello World!";
*str = 'B'; // Bus Error!
然而,当使用复合文字时,我很快发现它们是完全可修改的(并锁定生成的机器代码,你会看到它们被推到堆栈上):
char* str = (char[]){"Hello World"};
*str = 'B'; // A-Okay!
我正在使用clang-703.0.29
进行编译。这两个例子不应该生成完全相同的机器代码吗?如果它是可修改的,复合文字真的是文字吗?
编辑:更简短的例子是:
"Hello World"[0] = 'B'; // Bus Error!
(char[]){"Hello World"}[0] = 'B'; // Okay!
答案 0 :(得分:8)
复合文字是左值,其元素的值是可修改的。在
的情况下char* str = (char[]){"Hello World"};
*str = 'B'; // A-Okay!
您正在修改合法的复合文字。
C11-§6.5.2.5/ 4:
如果类型名称指定了未知大小的数组,则大小由6.7.9中指定的初始化列表确定,,复合文字的类型是已完成数组类型的类型 。否则(当类型名称指定对象类型时),类型 复合文字的大小是由类型名称指定的。 在任何一种情况下,结果都是左值。
可以看出复合文字的类型是一个完整的数组类型并且是左值,因此它可以修改,不像字符串文字
标准也提到
§6.5.2.5/ 7:
字符串文字和具有const限定类型的复合文字不需要指定不同的对象。 101
进一步说:
11示例4可以通过以下结构指定只读复合文字:
(const float []){1e0, 1e1, 1e2, 1e3, 1e4, 1e5, 1e6}
12示例5以下三个表达具有不同的含义:
"/tmp/fileXXXXXX" (char []){"/tmp/fileXXXXXX"} (const char []){"/tmp/fileXXXXXX"}
第一个始终具有静态存储持续时间,类型数组为
char
,但无需修改;最后两个在函数体内发生自动存储持续时间,并且中的第一个 两个是可修改的。13示例6与字符串文字一样,const限定的复合文字可以放入只读内存中,甚至可以共享。例如,
如果文字的存储是共享的,(const char []){"abc"} == "abc"
可能会产生1。
答案 1 :(得分:0)
复合文字语法是一个简短的表达式,等效于带有初始化程序的本地声明,然后是对这样声明的未命名对象的引用:
char *str = (char[]){ "Hello World" };
等效于:
char __unnamed__[] = { "Hello world" };
char *str = __unnamed__;
__unnamed__
具有自动存储功能,并且定义为可修改的,可以通过初始化为指向它的指针str
对其进行修改。
对于char *str = "Hello World!";
,str
指向的对象不应该被修改。实际上,尝试修改它具有未定义的行为。
C标准本来可以将字符串文字定义为类型const char[]
而不是char[]
,但这会在旧代码中生成许多警告和错误。
但是建议将一个标志传递给编译器以隐式地使这样的字符串文字const
并使整个项目const
正确,即:定义所有不用于修改其指针的指针参数。对象为const
。对于gcc
和clang
,命令行选项为-Wwrite-strings
。我也强烈建议启用更多警告,并使其对-Wall -W -Werror
致命。