如何在Linux内核中实现percpu指针?

时间:2013-06-07 07:53:31

标签: linux linux-kernel smp

在多处理器上,每个核心都可以拥有自己的变量。我认为它们在不同的地址中是不同的变量,尽管它们在相同的过程中并且具有相同的名称。

但我想知道,内核是如何实现的呢?它是否会分配一块内存来存放所有的percpu指针,并且每次将指针重定向到某个带有移位的地址?

1 个答案:

答案 0 :(得分:22)

正常的全局变量不是每个CPU。自动变量在堆栈上,不同的CPU使用不同的堆栈,因此它们自然会获得单独的变量。

我猜你是指Linux的每CPU变量基础设施 大多数魔法在这里(asm-generic/percpu.h):

extern unsigned long __per_cpu_offset[NR_CPUS];

#define per_cpu_offset(x) (__per_cpu_offset[x])

/* Separate out the type, so (int[3], foo) works. */
#define DEFINE_PER_CPU(type, name) \
    __attribute__((__section__(".data.percpu"))) __typeof__(type) per_cpu__##name

/* var is in discarded region: offset to particular copy we want */
#define per_cpu(var, cpu) (*RELOC_HIDE(&per_cpu__##var, __per_cpu_offset[cpu]))
#define __get_cpu_var(var) per_cpu(var, smp_processor_id())

RELOC_HIDE(ptr, offset)只是将ptr提前给定的偏移量(以字节为单位)(无论指针类型如何)。

它做了什么?

  1. 定义DEFINE_PER_CPU(int, x)时,会在特殊__per_cpu_x部分中创建一个整数.data.percpu
  2. 加载内核时,此部分会多次加载 - 每个CPU加载一次(这部分魔法不在上面的代码中)。
  3. __per_cpu_offset数组填充了副本之间的距离。假设使用了每个cpu数据1000个字节,__per_cpu_offset[n]将包含1000*n
  4. 在加载期间,符号per_cpu__x将重新定位到CPU 0的per_cpu__x
  5. __get_cpu_var(x),在CPU 3上运行时,将转换为*RELOC_HIDE(&per_cpu__x, __per_cpu_offset[3])。这从CPU 0的x开始,在CPU 0的数据和CPU 3之间添加偏移量,并最终取消引用结果指针。