我知道Intel Xeon phi协处理器SE10X有61个内核 建议仅使用60个核心,因为1个核心用于卸载守护程序。 另外,由于intel xeon phi协处理器5110P有60个内核,建议使用59个内核吗?
答案 0 :(得分:3)
明显的亲和力
在英特尔MPSS下,许多内核服务和后台程序都与“自举处理器”(BSP)相关联,后者是最后一个物理内核。这也是卸载守护程序运行支持卸载数据传输所需服务的地方。因此,通常明智的做法是避免将此核心用于用户代码。 (实际上,正如已经讨论过的,卸载系统通过从卸载进程的默认关联中删除最后一个核心上的逻辑CPU来自动执行此操作)。
卸载的程序继承隐藏最后一个核心的关联性映射,该核心专用于卸载系统功能。本机程序可以使用所有核心,使平衡线程所需的计算略有不同。
这些来源都不是针对任何MIC模型的,它们与架构有关;因此,如果您卸载到设备并且不使用默认关联,那么您应该确实避免使用最后一个核心。
答案 1 :(得分:1)
我在intel xeon phi 7120p卡上评估了我的测试代码的性能。我观察到代码性能最佳时没有。线程数是(核数 - 1)的倍数。这是因为其中一个核心正在忙于运行Linux微操作系统服务。
一般来说:
No. of threads to create >= K * T * (N-1)
K = Positive integer (=2 works fine)
T = No. of thread contexts on hardware(4 in my case)
N = No. of cores present on hardware.
答案 2 :(得分:1)
当您在卸载模式下执行工作负载时(当应用程序在CPU上运行并将一些计算卸载到Xeon Phi时),建议为卸载运行时保留1个核心。 Xeon Phi端有一个COI恶魔,它运行四个服务线程来管理卸载活动。请记住,Xeon Phi上的1个物理核心运行4个硬件线程。 如果应用程序直接在Xeon Phi卡上启动,则可以使用所有可用内核。因为现在有任何卸载活动。