有没有办法以以编程方式检查C ++应用程序使用的内核数量?
我正在寻找Windows/Linux
解决方案,但当然平台无关的解决方案会更好,我想它要求太多了。
答案 0 :(得分:3)
无法知道应用程序使用多少个核心。但你可以通过它拥有的线程数来猜测。
对于Windows:
您将要使用Tool Help Library作为微软调用它。更具体地说,您将要查看Traversing the Thread List示例,该示例可以获取应用程序具有的线程数。
微软真的很喜欢让他们的例子像人们可能做的那样丑陋,所以我提出了一个美化版本,你给它一个PID,它列出了与之相关的所有线程:
#include <windows.h>
#include <tlhelp32.h>
#include <tchar.h>
#include <cstdio>
bool list(unsigned int PID);
int main(void)
{
list(5532);
list(GetCurrentProcessId());
return 0;
}
bool list(unsigned int PID)
{
HANDLE thread_snap = INVALID_HANDLE_VALUE;
THREADENTRY32 te32;
// Take a snapshot of all running threads
thread_snap = CreateToolhelp32Snapshot(TH32CS_SNAPTHREAD, 0);
if (thread_snap == INVALID_HANDLE_VALUE) return false;
// Fill in the size of the structure before using it.
te32.dwSize = (DWORD)sizeof(THREADENTRY32);
// Retrieve information about the first thread, and exit if unsuccessful
if (!Thread32First(thread_snap, &te32))
{
CloseHandle(thread_snap);
return false;
}
// Now walk the thread list of the system, and display information about each thread associated with the specified process
printf("Printing threads for PID %u\n", PID);
do
{
if (te32.th32OwnerProcessID == PID)
{
printf( "THREAD ID = 0x%08X with base priority %u and delta priority %u\n", (unsigned int)te32.th32ThreadID, (unsigned int)te32.tpBasePri, (unsigned int)te32.tpDeltaPri);
}
}
while (Thread32Next(thread_snap, &te32));
printf("Done printing threads for PID %u\n\n", PID);
// Don't forget to clean up the snapshot object.
CloseHandle(thread_snap);
return true;
}
输入:
5532
(Steam的服务流程ID),GetCurrentProcessId()
输出:
Printing threads for PID 5532
THREAD ID = 0x00000BCC with base priority 8 and delta priority 0
THREAD ID = 0x0000041C with base priority 8 and delta priority 0
THREAD ID = 0x00001924 with base priority 8 and delta priority 0
THREAD ID = 0x00000C9C with base priority 8 and delta priority 0
Done printing threads for PID 5532
Printing threads for PID 9836
THREAD ID = 0x000000FC with base priority 8 and delta priority 0
Done printing threads for PID 9836
你可以假设,如果一个应用程序使用的线程数多于cpu所拥有的核心数,它可能会使用所有这些线程,如果它使用的更少,它可能使用x个核心,其中x是线程数。 / p>
如果你想更进一步,你可以获得每个线程的CPU使用率,以便更好地近似它使用多少个核心。
另一种我不能完全确定可行的方法是获取应用程序所有线程的CPU使用率并将其加起来(以百分比表示),取出系统所拥有的核心数,将该数字提高到-1的幂并将其乘以100(x^-1*100
),其中x是核心数,然后将所有线程的CPU使用百分比除以核心可以处理多少核心的百分比它使用。
例如:
鉴于4个核心和4个线程的应用程序,其中2个占CPU使用率的25%,其他2个占11%。
你可以假设它使用:
(25 + 25 + 11 + 11)/((4 ^ -1)* 100)= 2.88核心
问题:
可能并非所有内核都以相同的速度运行。在这种情况下,它无法按预期工作。
如果您使用的是c ++ 11,则可以找到系统对std::thread::hardware_concurrency()
所拥有的核心数。
或者您也可以traverse the process list获取进程所拥有的线程数,但它没有关于每个线程的高级信息,如遍历线程。
答案 1 :(得分:3)
要在这里做出第二个答案,因为最后一个答案已经足够长了,这个答案的方向会略有不同。
经过进一步的研究,我确定实际上有一种方法可以准确地确定每个线程/可以运行/运行的核心。我提出的代码使用了大量的Windows特定库,但肯定有Linux等效函数。
更具体地说,它使用wbemuuid.lib
,comdef.h
和Wbemidl.h
。
代码:
#define _WIN32_DCOM
#include <iostream>
#include <comdef.h>
#include <Wbemidl.h>
#include <cstdarg>
#include <string>
#pragma comment(lib, "wbemuuid.lib")
using namespace std;
DWORD affinity(unsigned int ID)
{
HANDLE threadh = OpenThread(THREAD_SET_INFORMATION | THREAD_QUERY_INFORMATION, FALSE, ID);
DWORD mask = 1;
DWORD old = 0;
while (mask)
{
old = SetThreadAffinityMask(threadh, mask);
if (old)
{
SetThreadAffinityMask(threadh, old);
return old;
}
else
{
if (GetLastError() != ERROR_INVALID_PARAMETER) return 0;
}
mask <<= 1;
}
return 0;
}
HRESULT connect(IWbemLocator** pLoc, IWbemServices** pSvc)
{
HRESULT hres;
hres = CoInitializeEx(0, COINIT_MULTITHREADED);
if (FAILED(hres))
{
cout << "Failed to initialize COM library. Error code = 0x" << hex << hres << endl;
return hres;
}
hres = CoInitializeSecurity(NULL, -1, NULL, NULL, RPC_C_AUTHN_LEVEL_DEFAULT, RPC_C_IMP_LEVEL_IMPERSONATE, NULL, EOAC_NONE, NULL);
if (FAILED(hres))
{
cout << "Failed to initialize security. Error code = 0x" << hex << hres << endl;
CoUninitialize();
return hres;
}
hres = CoCreateInstance( CLSID_WbemLocator, 0, CLSCTX_INPROC_SERVER, IID_IWbemLocator, (LPVOID*)&(*pLoc));
if (FAILED(hres))
{
cout << "Failed to create IWbemLocator object." << " Error code = 0x" << hex << hres << endl;
CoUninitialize();
return hres;
}
hres = (*pLoc)->ConnectServer(_bstr_t(L"ROOT\\CIMV2"), NULL, NULL, 0, NULL, 0, 0, &(*pSvc));
if (FAILED(hres))
{
cout << "Could not connect. Error code = 0x" << hex << hres << endl;
(*pLoc)->Release();
CoUninitialize();
return hres;
}
hres = CoSetProxyBlanket((*pSvc), RPC_C_AUTHN_WINNT, RPC_C_AUTHZ_NONE, NULL, RPC_C_AUTHN_LEVEL_CALL, RPC_C_IMP_LEVEL_IMPERSONATE, NULL, EOAC_NONE);
if (FAILED(hres))
{
cout << "Could not set proxy blanket. Error code = 0x" << hex << hres << endl;
(*pSvc)->Release();
(*pLoc)->Release();
CoUninitialize();
return hres;
}
return hres;
}
HRESULT query(IWbemLocator** pLoc, IWbemServices** pSvc, IEnumWbemClassObject** pEnum, const char* qry)
{
HRESULT hres;
hres = (*pSvc)->ExecQuery(bstr_t("WQL"), bstr_t(qry), WBEM_FLAG_FORWARD_ONLY | WBEM_FLAG_RETURN_IMMEDIATELY, NULL, &(*pEnum));
if (FAILED(hres))
{
cout << "Query for operating system name failed." << " Error code = 0x" << hex << hres << endl;
(*pSvc)->Release();
(*pLoc)->Release();
CoUninitialize();
return 1;
}
return hres;
}
HRESULT parse(IWbemLocator** pLoc, IWbemServices** pSvc, IEnumWbemClassObject** pEnum, IWbemClassObject** pCls, size_t n_args, ...)
{
HRESULT hres;
ULONG uReturn = 0;
while (pEnum)
{
hres = (*pEnum)->Next(WBEM_INFINITE, 1, &(*pCls), &uReturn);
if (0 == uReturn)
{
break;
}
VARIANT vtProp;
va_list vl;
va_start(vl, n_args);
for (size_t i = 0; i < n_args; i++)
{
const char* name = va_arg(vl, const char*);
int wchars_num = MultiByteToWideChar(CP_UTF8, 0, name, -1, NULL, 0);
wchar_t* wname = new wchar_t[wchars_num];
MultiByteToWideChar(CP_UTF8 , 0, name, -1, wname, wchars_num);
hres = (*pCls)->Get(wname, 0, &vtProp, 0, 0);
wcout << wname << " : " << std::to_wstring((size_t)vtProp.bstrVal) << " : " << affinity((DWORD)vtProp.bstrVal) << endl;
delete[] wname;
}
va_end(vl);
VariantClear(&vtProp);
}
return hres;
}
int main(int argc, char **argv)
{
string qry = "SELECT * FROM Win32_PerfFormattedData_PerfProc_Thread WHERE IDProcess = 7424";
HRESULT hres;
IWbemLocator* pLoc = NULL;
IWbemServices* pSvc = NULL;
IEnumWbemClassObject* pEnum = NULL;
IWbemClassObject* pCls = NULL;
hres = connect(&pLoc, &pSvc);
if (FAILED(hres)) return 1;
hres = query(&pLoc, &pSvc, &pEnum, qry.c_str());
if (FAILED(hres)) return 1;
hres = parse(&pLoc, &pSvc, &pEnum, &pCls, 1, "IDThread");
if (FAILED(hres)) return 1;
pSvc->Release();
pLoc->Release();
pEnum->Release();
pCls->Release();
CoUninitialize();
return 0;
}
Prime95停止时的输出:
IDThread : 9072 : 15
IDThread : 7052 : 15
当Prime95使用4个工作线程运行时的输出:
IDThread : 9072 : 15
IDThread : 7052 : 15
IDThread : 5600 : 1
IDThread : 5888 : 2
IDThread : 2888 : 4
IDThread : 9348 : 8
PercentProcessorTime : 0
PercentProcessorTime : 0
PercentProcessorTime : 70
PercentProcessorTime : 83
PercentProcessorTime : 80
PercentProcessorTime : 75
当Prime95使用2个工作线程运行时的输出:
IDThread : 9072 : 15
IDThread : 7052 : 15
IDThread : 2352 : 15
IDThread : 8396 : 15
的说明:强> 的
稍微解释一下代码:
7424
是Prime95的PID。SELECT * FROM Win32_PerfFormattedData_PerfProc_Thread WHERE IDProcess = 7424
是我用来列出与特定PID相关的所有线程的查询。您可以在Win32_PerfFormattedData_PerfProc_Thread
here找到所有信息的列表。您所要做的就是将parse()
中给出的参数从ThreadID
切换为例如PercentProcessorTime
,并输出CPU使用百分比。的亲和性:强> 的
函数affinity()
将线程关联设置为新的线程,以获取旧线程,然后将其设置回旧线程。现在,我不确定如何从亲和力中获取实际核心数,我知道如果它的例如1
它运行在核心编号1上,如果它的2
运行核心编号2 ,如果它7
在核心4和3上运行,或者沿着那些线运行。我还没有完全搞清楚。
将其移植到linux:
在linux上它更容易一些,例如获取核心可以使用sched_getcpu
/ sched_getaffinity
之类的东西。通过一些谷歌搜索我确信你可以找到一个方法列出与进程相关的所有线程。