我是一个关于cuda编程的新人。
我必须使用关于我的应用程序的nvprof进行GPU分析。
我找到一个度量标准l2_subp0_write_sector_misses,表示从L2缓存的片0发送到DRAM的写请求数。
但我不知道切片是什么意思。
就像我猜测的那样,切片是sm,因为Gtx750有4个sm,事件中有4个切片(l2_subp0_write_sector_misses,l2_subp1_write_sector_misses,l2_subp2_write_sector_misses,l3_subp0_write_sector_misses)
但是,当我使用1个线程测试应用程序时,所有write_misses事件都有值。
我认为如果一个切片是一个sm,只有一个write_misses有值而其他的是0。
什么是切片?
1个线程使用1个sm是不对的?