尝试在C中分配新内存时为什么需要对齐

时间:2013-10-15 03:04:21

标签: c memory-management

现在我正在阅读C接口和实现。第四个图表是内存管理。它表示该附件确保任何类型的数据都可以存储在由Mem_alloc函数返回的块中。我如何理解这句话?是在管理记忆时有必要调整吗?

对齐代码如下:

union align {
#ifdef MAXALIGN
        char pad[MAXALIGN];
#else
        int i;
        long l;
        long *lp;
        void *p;
        void (*fp)(void);
        float f;
        double d;
        long double ld;
#endif
void *Mem_alloc(long nbytes, const char *file, int line){
        struct descriptor *bp;
        void *ptr;
        assert(nbytes > 0);
        nbytes = ((nbytes + sizeof (union align) - 1)/
                (sizeof (union align)))*(sizeof (union align));
        for (bp = freelist.free; bp; bp = bp->free) {
                if (bp->size > nbytes) {
                        bp->size -= nbytes;
                        ptr = (char *)bp->ptr + bp->size;
                        if ((bp = dalloc(ptr, nbytes, file, line)) != NULL) {
                                unsigned h = hash(ptr, htab);
                                bp->link = htab[h];
                                htab[h] = bp;
                                return ptr;
                        } else
                                {
                                        if (file == NULL)
                                                RAISE(Mem_Failed);
                                        else
                                                Except_raise(&Mem_Failed, file, line);
                                }
                }
                if (bp == &freelist) {
                        struct descriptor *newptr;
                        if ((ptr = malloc(nbytes + NALLOC)) == NULL
                        ||  (newptr = dalloc(ptr, nbytes + NALLOC,
                                        __FILE__, __LINE__)) == NULL)
                                {
                                        if (file == NULL)
                                                RAISE(Mem_Failed);
                                        else
                                                Except_raise(&Mem_Failed, file, line);
                                }
                        newptr->free = freelist.free;
                        freelist.free = newptr;
                }
        }
        assert(0);
        return NULL;
}
    };

 void *Mem_resize(void *ptr, long nbytes,
        const char *file, int line) {
        struct descriptor *bp;
        void *newptr;
        assert(ptr);
        assert(nbytes > 0);
        if (((unsigned long)ptr)%(sizeof (union align)) != 0
        || (bp = find(ptr)) == NULL || bp->free)
                Except_raise(&Assert_Failed, file, line);
        newptr = Mem_alloc(nbytes, file, line);
        memcpy(newptr, ptr,
                nbytes < bp->size ? nbytes : bp->size);
        Mem_free(ptr, file, line);
        return newptr;
}  

我如何理解这些代码?为什么需要if(((unsigned long)ptr)%(sizeof(union align))!= 0调整空间大小?

1 个答案:

答案 0 :(得分:1)

CPU在处理数据方面存在局限性。例如,指针通常必须是32位CPU的4字节对齐和64位CPU的8字节对齐。此外,在允许的情况下,在非对齐边界上加载和存储数据可能会有性能损失。例如,CPU可能能够从奇数地址加载,但它将需要两倍的周期。这通常是因为存储器硬件针对4,8或16字节边界上的数据进行了优化,并且必须在一个周期内加载数据字的下半部分,然后在下一个周期加载上部。

因此,在实现编译器时,您希望它能够在具有这些对齐需求的CPU上正常工作。

See here以英特尔IA-64对齐要求为例:

  
      
  • 在任意地址对齐8位数据
  •   
  • 将16位数据对齐以包含在对齐的四字节字中
  •   
  • 对齐32位数据,使其基址为四的倍数
  •   
  • 对齐64位数据,使其基址为8的倍数
  •   
  • 对齐80位数据,使其基址为16的倍数
  •   
  • 对齐128位数据,使其基址为16的倍数
  •