Question

现在我正在阅读C接口和实现。第四个图表是内存管理。它表示该附件确保任何类型的数据都可以存储在由Mem_alloc函数返回的块中。我如何理解这句话？是在管理记忆时有必要调整吗？

对齐代码如下：

union align {
#ifdef MAXALIGN
        char pad[MAXALIGN];
#else
        int i;
        long l;
        long *lp;
        void *p;
        void (*fp)(void);
        float f;
        double d;
        long double ld;
#endif
void *Mem_alloc(long nbytes, const char *file, int line){
        struct descriptor *bp;
        void *ptr;
        assert(nbytes > 0);
        nbytes = ((nbytes + sizeof (union align) - 1)/
                (sizeof (union align)))*(sizeof (union align));
        for (bp = freelist.free; bp; bp = bp->free) {
                if (bp->size > nbytes) {
                        bp->size -= nbytes;
                        ptr = (char *)bp->ptr + bp->size;
                        if ((bp = dalloc(ptr, nbytes, file, line)) != NULL) {
                                unsigned h = hash(ptr, htab);
                                bp->link = htab[h];
                                htab[h] = bp;
                                return ptr;
                        } else
                                {
                                        if (file == NULL)
                                                RAISE(Mem_Failed);
                                        else
                                                Except_raise(&Mem_Failed, file, line);
                                }
                }
                if (bp == &freelist) {
                        struct descriptor *newptr;
                        if ((ptr = malloc(nbytes + NALLOC)) == NULL
                        ||  (newptr = dalloc(ptr, nbytes + NALLOC,
                                        __FILE__, __LINE__)) == NULL)
                                {
                                        if (file == NULL)
                                                RAISE(Mem_Failed);
                                        else
                                                Except_raise(&Mem_Failed, file, line);
                                }
                        newptr->free = freelist.free;
                        freelist.free = newptr;
                }
        }
        assert(0);
        return NULL;
}
    };

 void *Mem_resize(void *ptr, long nbytes,
        const char *file, int line) {
        struct descriptor *bp;
        void *newptr;
        assert(ptr);
        assert(nbytes > 0);
        if (((unsigned long)ptr)%(sizeof (union align)) != 0
        || (bp = find(ptr)) == NULL || bp->free)
                Except_raise(&Assert_Failed, file, line);
        newptr = Mem_alloc(nbytes, file, line);
        memcpy(newptr, ptr,
                nbytes < bp->size ? nbytes : bp->size);
        Mem_free(ptr, file, line);
        return newptr;
}

我如何理解这些代码？为什么需要if（（（unsigned long）ptr）％（sizeof（union align））！= 0调整空间大小？

Answer 1

CPU在处理数据方面存在局限性。例如，指针通常必须是32位CPU的4字节对齐和64位CPU的8字节对齐。此外，在允许的情况下，在非对齐边界上加载和存储数据可能会有性能损失。例如，CPU可能能够从奇数地址加载，但它将需要两倍的周期。这通常是因为存储器硬件针对4,8或16字节边界上的数据进行了优化，并且必须在一个周期内加载数据字的下半部分，然后在下一个周期加载上部。

因此，在实现编译器时，您希望它能够在具有这些对齐需求的CPU上正常工作。

See here以英特尔IA-64对齐要求为例：

在任意地址对齐8位数据

将16位数据对齐以包含在对齐的四字节字中

对齐32位数据，使其基址为四的倍数

对齐64位数据，使其基址为8的倍数

对齐80位数据，使其基址为16的倍数

对齐128位数据，使其基址为16的倍数

尝试在C中分配新内存时为什么需要对齐

1 个答案: