我知道这可以通过使用带位操作函数的循环来实现,但是我想知道是否有更快更直接的方法。我使用大约64位作为我的数据结构的标题,这可能是许多不同的事情。线程解码头,然后分配正确的结构,然后对该数据结构进行操作。但是现在我正在使用位操作函数来读取和写入标题,这不太理想,我读过cuda和ptx文档,并没有找到任何可以帮助我的东西。我想知道如果我确实错过了任何一个,或者实际上没有专门用于一次读取一个位的特定功能。
答案 0 :(得分:1)
你没找到你要找的东西,因为它不存在。
仅在8,16,32和64位类型上的PTX supports内存事务,或者那些相同基本类型的2或4个元素向量。没有关于从存储器中的任意字加载或存储单个位的指令。