这段代码似乎有效,但我是否正确使用了InterlockedIncrement函数? m_count的正确内存对齐是我主要关心的问题。假设我们在x86-64系统上并编译一个64位应用程序(如果重要的话)。顺便说一句,为了我的实际目的,我不能将m_count声明为volatile long,然后使用InterlockedIncrement(& m_count);但它必须是指向堆中数据的指针。
#include <Windows.h>
#include <malloc.h>
class ThreadSafeCounter {
public:
ThreadSafeCounter()
{
// Are those arguments for size and alignment correct?
void* placement = _aligned_malloc( sizeof(long), sizeof(long) );
m_count = new (placement) long(0);
}
~ThreadSafeCounter()
{
_aligned_free( const_cast<long*>(m_count) );
}
void AddOne()
{
InterlockedIncrement(m_count);
}
long GetCount()
{
return *m_count;
}
private:
volatile long* m_count;
};
答案 0 :(得分:5)
堆分配器已将返回的地址与本机平台字大小对齐。 x86为4个字节,x64为8个字节。您在任一平台上使用 long ,32位用于MSVC。无需跳过_aligned_malloc()箍。
答案 1 :(得分:3)
这是一个平台架构细节,但你需要记住,原子操作比对齐更多。平台ABI通常确保默认情况下原始数据类型对齐,以便任何操作(包括原子)都可以工作。 malloc()永远不会返回一个未对齐的指针,即使你要求一个字节也不会。
虽然,除此之外,还要特别注意http://en.wikipedia.org/wiki/False_sharing - 意味着除了需要对齐(通常是sizeof(long)
)之外,还必须确保只托管一个原子访问的变量在同一个高速缓存行内。
如果您打算使用/允许这些计数器的数组,这一点尤为重要。
Microsoft的编译器使用__declspec(align(value))
来指示编译器保证特定的结构对齐。正如其他人所提到的,似乎没有特别需要对这样的数据结构/类进行堆分配,但我不知道你是否需要pimpl用于别的东西。
答案 2 :(得分:1)
对于您的用例,最简单的方法是通过继承使用侵入式引用计数,从而消除这种需求。
但是,如果你绝望,只需查看MSVC的shared_ptr实现。
typename aligned_storage<sizeof(_Ty),
alignment_of<_Ty>::value>::type _Storage;
};
_Ty *_Getptr() const { // get pointer
return ((_Ty *)&_Storage);
}
C-cast非常讨厌。但是,这告诉我,这个对象肯定会使用类型特征进行正确的对齐。