我看到在使用GCC的Linux系统上,字符串文字的地址似乎比其他变量小得多。例如,以下代码生成下面显示的o / p。
#include <stdio.h>
int main()
{
char *str1 = "Mesg 1";
char *str2 = "Mesg 2";
char str3[] = "Mesg 3";
char str4[] = "Mesg 4";
printf("str1 = %p\n", (void *) str1);
printf("str2 = %p\n", (void *) str2);
printf("&str3 = %p\n", (void *) str3);
printf("&str4 = %p\n", (void *) str4);
return 0;
}
输出:
str1 = 0x400668
str2 = 0x40066f
&str3 = 0x7fffcc990b10
&str4 = 0x7fffcc990b00
这种用法是否有一个固定的地址空间?
答案 0 :(得分:6)
标准没有指定字符串文字所在的位置,但最有可能是在只读数据部分。例如,在使用objdump
的Unix系统上,您可以像这样检查只读数据部分:
objdump -s -j .rodata a.out
并使用Live Example我们可以看到类似于此的输出:
Contents of section .rodata:
400758 01000200 4d657367 20310073 74723120 ....Mesg 1.str1
400768 3d202570 0a004d65 73672032 00737472 = %p..Mesg 2.str
400778 32203d20 25700a00 26737472 33203d20 2 = %p..&str3 =
400788 25700a00 26737472 34203d20 25700a00 %p..&str4 = %p..
C99标准草案部分6.4.5
字符串文字第5段说:
[...]多字节字符序列用于初始化静态存储持续时间的数组,长度足以包含序列。[...]
表示字符串文字的生命周期是程序的生命周期,第6段表示:
如果这些数组的元素具有不同的数据,则未指定 适当的价值观如果程序试图修改这样的数组,则行为是 未定义。
所以我们不知道它们是否是不同的,这将是一个实现选择,但我们知道我们无法修改它们。否则,它没有指定它们应该如何存储。
答案 1 :(得分:3)
char *str1 = "Mesg 1";
char *str2 = "Mesg 2";
char str3[] = "Mesg 3";
char str4[] = "Mesg 4";
str1
和str2
是指针对象,指向字符串文字 - 或者更确切地说,指向与这些字符串文字相关联的匿名静态数组对象。这些数组具有静态存储持续时间,这意味着它们存在于整个程序执行中。它们也是只读的,这可能会影响实现选择存储它们的位置。 (顺便说一句,因为字符串文字是只读的,所以指向它们的指针应该声明为const
。)
str3
和str4
不是指针;它们是使用指定值初始化的数组对象。它们具有自动存储持续时间,这意味着它们仅在执行最近的封闭块期间存在(在这种情况下,main
函数正在执行时)。对于main
,除非您使用递归调用或atexit
处理程序进行操作,否则没有太大的实际区别,但对于其他函数而言,它很重要。具有自动存储持续时间的对象通常在堆栈上分配,并在函数返回时解除分配。
(在大多数情况下,数组表达式被隐式转换为指向数组第一个元素的指针。有关详细信息,请参阅comp.lang.c FAQ的第6节。)
在您的系统上,显然只读的静态对象分配在0x400000
附近的低地址,堆栈位于0x800000000000
以下的更高地址(2 47 )。这可能因系统而异。
重要的是要注意所有这些地址具有相同的长度。您好像使用的是64位系统。 0x400668
不是32位地址;它是一个64位的地址碰巧有一个小的数值。 printf
用于%p
的输出格式是实现定义的; 可以打印出来:
str1 = 0x0000000000400668
str2 = 0x000000000040066f
&str3 = 0x00007fffcc990b10
&str4 = 0x00007fffcc990b00
答案 2 :(得分:2)
这种用法是否有一个固定的地址空间?
不,这完全取决于实现。只有确定的事情是:
答案 3 :(得分:1)
某些实现将字符串文字放在只读数据段中,这可能与常规数据有明显不同的地址。但这取决于实施方式,所以不要认为它是通用的。