我想了解以下内容的总体统计数据:
答案 0 :(得分:6)
使用perf,例如:
# perf stat -B dd if=/dev/zero of=/dev/null count=1000000
1000000+0 records in
1000000+0 records out
512000000 bytes (512 MB) copied, 0.956217 s, 535 MB/s
Performance counter stats for 'dd if=/dev/zero of=/dev/null count=1000000':
5,099 cache-misses # 0.005 M/sec (scaled from 66.58%)
235,384 cache-references # 0.246 M/sec (scaled from 66.56%)
9,281,660 branch-misses # 3.858 % (scaled from 33.50%)
240,609,766 branches # 251.559 M/sec (scaled from 33.66%)
1,403,561,257 instructions # 0.679 IPC (scaled from 50.23%)
2,066,201,729 cycles # 2160.227 M/sec (scaled from 66.67%)
217 page-faults # 0.000 M/sec
3 CPU-migrations # 0.000 M/sec
83 context-switches # 0.000 M/sec
956.474238 task-clock-msecs # 0.999 CPUs
0.957617512 seconds time elapsed
答案 1 :(得分:5)
检查Linux的perf subsystem这是从Linux系统获得软硬件性能计数器所需的方式。
答案 2 :(得分:2)
也许您应该考虑编写Linux内核模块(LKM)。
这里有一个教程:http://www.tldp.org/LDP/lkmpg/2.6/html/
如果您需要准确的分析系统,您可以将内核模块附加到某个中断或任何其他有效入口点*,并保存(没有多少指令!)您需要考虑的内容。然后,在中断之后,定期收集并分析该数据。
您可以通过文件系统中的特殊文件(通过mknode在用户空间中创建或使用MKDEV / register_chrdev初始化)以与其他模块相同的方式导出信息。
上面的链接中有一些信息。
*
例如,您可以将模块附加到读取系统调用(用您的实际读取包装),或导出文件并捕获打开/关闭尝试。
后者的使用示例如下:
void f() {
int fd_prof;
fd_prof = open("/dev/profiler", O_RDONLY);
/* Do whichever thing you want to profile */
close(fd_prof);
/* Read profiled data from /dev/profiled_data or wherever you want
* to export it to */
请注意,在编译LKM时,您无法访问标准C库,因为内核空间中不存在libc。
别担心,你仍然可以在内核空间中使用sprintf这样的函数,当然,你可以直接访问(没有上下文切换)任何系统调用(读,写......)
答案 3 :(得分:2)
您可以通过某种程度的分辨率从/proc
中获取所有这些信息,如果您需要更多rez,则可以调整嵌入式系统的内核。
您可以使用$ vmstat 1
监控您想要的信息,然后您可以查看来自vmstat的来源,以确切了解他们是如何从/proc
http://procps.sourceforge.net.