最近花了一些时间研究如何在用户态实现自旋锁,这里简单的总结一下。本文的所有代码以及配套的测试用代码都可以在我的github上找到。
问题在哪
首先明确问题,我们需要一种用户态实现的线程同步机制,正确性当然是最重要的。本文的目的是实现正确的自旋锁(自旋锁比较简单轻量,但了解了原理后实现互斥锁并不困难,自行维护等待关系并通过 futex 对线程执行挂起、唤醒操作就可以了)。
概念上这个问题很简单啊,是不是我们只要用一个线程共享的变量做互斥,然后在线程获得和释放锁时修改这个变量就行了?比如像下面这样:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 |
#ifndef _FAKELOCK_H_ #define _FAKELOCK_H_ class FakeLock { public: FakeLock() {}; virtual ~FakeLock() {}; FakeLock(const FakeLock&) = delete; FakeLock &operator=(const FakeLock&) = delete; virtual int lock() { while (1L == lock_) { asm volatile("pause\n" ::: "memory"); } lock_ = 1L; return 0; } virtual int unlock() { lock_ = 0L; return 0; } private: int64_t lock_; }; #endif /* _FAKELOCK_H_ */ |
然而事情没这么简单,因为对这个变量的操作不是原子的,所以会导致这个锁无法正确的运行(即使在单核环境也如此),因此我们需要利用硬件提供的原子操作来实现锁(FYI. 一种不需要原子操作的锁实现方法见前文中提到过的Dekker算法,非常漂亮,但通用性不足)。
除此之外,另一个问题是多核争用的性能问题,这一点我会在后文中提到。
另外由于在用户态实现锁对硬件体系结构提供的一致性保证非常相关,所以必须注明,本文中所有实现针对于x86体系结构(也就是acquire-release语义TSO内存模型),不具备可移植性。