如何确认NUMA?

时间:2012-04-11 16:10:31

标签: java linux numa

如何确认主机是否具有NUMA感知功能? Oracle doc表示NUMA意识从内核2.6.19开始,但NUMA man page表示它是在2.6.14引入的。我想确保以-XX:+UseNUMA开头的Java进程实际上正在利用某些东西。

检查numa_maps,我看到我有它们:

# find /proc -name numa_maps
/proc/1/task/1/numa_maps
/proc/1/numa_maps
/proc/2/task/2/numa_maps
/proc/2/numa_maps
/proc/3/task/3/numa_maps

虽然我的内核落后于Oracle所说的内容:

# uname -sr
Linux 2.6.18-92.el5

我目前在RHEL5.1上使用64位jdk1.6.0_29。

2 个答案:

答案 0 :(得分:8)

这些/ proc文件的存在表明你的linux内核是numa感知的。不要过多地关注自己与版本号的比较,特别是对于Oracle / RHEL内核,供应商在不保持版本字符串“最新”的情况下移植/移植许多功能。

测试同样事物的其他方法:

$ grep NUMA=y /boot/config-`uname -r`
CONFIG_NUMA=y
CONFIG_K8_NUMA=y
CONFIG_X86_64_ACPI_NUMA=y
CONFIG_ACPI_NUMA=y

$ numactl --hardware
available: 2 nodes (0-1)
node 0 size: 18156 MB
node 0 free: 9053 MB
node 1 size: 18180 MB
node 1 free: 6853 MB
node distances:
node   0   1
  0:  10  20
  1:  20  10

答案 1 :(得分:1)

Oracle doc还指出:

注意:Linux内核中存在一个已知错误,可能导致JVM在使用-XX时崩溃:UseNUMA。该错误已于2012年修复,因此不应影响最新版本的Linux内核。要查看您的内核是否存在此错误,您可以运行native reproducer

我在这里重现了它的简单性:

http://docs.oracle.com/javase/7/docs/technotes/guides/vm/reproducer.c

要构建重现器,您可能需要安装 numactl numactl-devel 包,具体取决于您的发行版。有关详细信息,请参阅man numa_maps

#include <numaif.h>
#include <numa.h>
#include <stddef.h>
#include <sys/mman.h>
#include <stdint.h>

int main(void) {
   if (numa_all_nodes_ptr == (void*)0) {
     return -1;
   }

   size_t pagesize = getpagesize();

   void* mapped_memory = mmap(NULL, 3 * pagesize, PROT_READ|PROT_WRITE,
MAP_PRIVATE|MAP_ANONYMOUS, -1, 0);
   if (mapped_memory == MAP_FAILED) {
     return -2;
   }

   void* page0 = mapped_memory;
   void* page1 = (void*)((uintptr_t)page0 + pagesize);
   void* page2 = (void*)((uintptr_t)page1 + pagesize); 

 // Set up the last page as interleaved.
   mbind(page2, pagesize, MPOL_INTERLEAVE, numa_all_nodes_ptr->maskp,
numa_all_nodes_ptr->size, 0);

   // Setup the last two pages as interleaved.
   mbind(page1, 2 * pagesize, MPOL_INTERLEAVE,
numa_all_nodes_ptr->maskp, numa_all_nodes_ptr->size, 0);

   *((char*)page2) = 2;
   *((char*)page1) = 1;
   *((char*)page0) = 0; // Crash here, when mbind_merge was broken.

   return 0;
}

所以,我采用歧义来表示2.6.19是第一个安全版本。