
在go语言中,sync/atomic包提供了一系列原子操作,例如compareandswapint32、compareandswappointer等,它们主要针对基本数据类型(如整型、指针)的单个机器字进行操作。然而,当我们需要对包含多个字段的自定义结构体(例如,一个包含指针和计数器的pointer_t类型)执行原子比较与交换(cas)操作时,会遇到一个核心限制:大多数硬件架构和go的标准库都不直接支持对整个复合结构体进行原子cas。
例如,在实现无锁队列等复杂并发数据结构时,我们可能需要原子地更新一个包含*node_t指针和uint计数器的pointer_t结构体,以确保操作的正确性和一致性。直接使用atomic.CompareAndSwap并传入一个结构体实例是不可能的。这要求我们采用间接的方法来模拟或实现对结构体的原子更新。
位窃取(Bit Stealing)是一种利用指针未使用的位来存储额外信息的技巧。在64位系统中,内存地址通常不会占用全部64位,例如,在某些架构上,地址可能只需要48位或56位。这为我们提供了将少量元数据(如一个小的计数器)编码到指针中的机会。
通过将一个小的计数器值“窃取”并编码到指针的未使用位中,我们可以将原本需要原子更新的两个字段(指针和计数器)合并成一个可以进行原子操作的单一值(即打包后的指针)。然后,我们可以使用atomic.CompareAndSwapPointer或atomic.CompareAndSwapUintptr来原子地更新这个打包值。
定义数据结构:
import (
"sync/atomic"
"unsafe"
)
type node_t struct {
value interface{}
// ... 其他字段
}
// pointer_t现在只包含一个打包后的指针
type pointer_t struct {
packedPtr uintptr // 存储了指针和计数器的组合值
}
// 假设我们有足够的位来存储计数器,例如低3位
const counterMask uintptr = 0x7 // 0b111,用于提取计数器
const pointerMask uintptr = ^counterMask // 用于提取纯净的指针编码与解码函数:
// pack 将 *node_t 指针和 uint 计数器打包成一个 uintptr
func pack(ptr *node_t, count uint) uintptr {
// 确保计数器不会溢出分配的位数
if count > uint(counterMask) {
panic("counter exceeds allocated bits")
}
return (uintptr(unsafe.Pointer(ptr)) & pointerMask) | (uintptr(count) & counterMask)
}
// unpackPtr 从打包的 uintptr 中提取 *node_t 指针
func unpackPtr(packed uintptr) *node_t {
return (*node_t)(unsafe.Pointer(packed & pointerMask))
}
// unpackCount 从打包的 uintptr 中提取计数器
func unpackCount(packed uintptr) uint {
return uint(packed & counterMask)
}原子CAS操作示例:
// 假设我们有一个原子操作的目标,例如一个无锁队列的尾部指针
var atomicTailPackedPtr uintptr
// 模拟对 tail.ptr->next 的CAS操作
func casTailNext(oldPacked, newPacked uintptr) bool {
return atomic.CompareAndSwapUintptr(&atomicTailPackedPtr, oldPacked, newPacked)
}
func updateTail(newNode *node_t) {
for {
// 1. 原子加载当前的打包指针和计数器
currentPacked := atomic.LoadUintptr(&atomicTailPackedPtr)
currentPtr := unpackPtr(currentPacked)
currentCount := unpackCount(currentPacked)
// 2. 根据业务逻辑计算新的指针和计数器
// 假设我们要更新ptr为newNode,并递增计数器
newCount := currentCount + 1
newPtr := newNode
// 3. 打包新的值
newPacked := pack(newPtr, newCount)
// 4. 尝试原子替换
if casTailNext(currentPacked, newPacked) {
return // 成功更新
}
// 否则,CAS失败,循环重试直到成功
}
}写时复制(COW)是一种更通用、更灵活的策略,适用于需要原子更新任意大小和复杂度的结构体。其核心思想是使要进行原子更新的结构体实例本身是不可变的。当需要修改结构体时,不是直接修改它,而是创建一个它的副本,在新副本上进行修改,然后原子地将指向旧结构体的指针替换为指向新结构体的指针。
通过将结构体字段定义为指向该结构体本身的指针(例如,next *pointer_t),我们实际上是在原子地替换一个指针,而不是直接修改结构体内容。每次更新都涉及创建新结构体、修改新结构体、然后原子地更新指向该结构体的指针。
修改数据结构:
import (
"sync/atomic"
"unsafe"
)
type node_t struct {
value interface{}
next *pointer_t // 关键改变:next现在是一个指向pointer_t的指针
}
type pointer_t struct {
ptr *node_t
count uint
}
// 假设我们有一个原子操作的目标,例如一个node_t的next字段
// 为了演示,我们使用一个全局变量来模拟被CAS的目标
var globalNodeNext *pointer_t原子CAS操作示例:
// casGlobalNodeNext 尝试原子地将 globalNodeNext 从 old 替换为 new
func casGlobalNodeNext(old, new *pointer_t) bool {
return atomic.CompareAndSwapPointer(
(*unsafe.Pointer)(unsafe.Pointer(&globalNodeNext)), // 将 **pointer_t 转换为 *unsafe.Pointer
unsafe.Pointer(old),
unsafe.Pointer(new),
)
}
func updateNodeNext(targetNode *node_t, newNodeVal *node_t) {
for {
// 1. 原子加载当前的 *pointer_t 指针
// 注意:这里需要将 **pointer_t 转换为 *unsafe.Pointer
oldNextPtr := (*pointer_t)(atomic.LoadPointer((*unsafe.Pointer)(unsafe.Pointer(&targetNode.next))))
// 2. 创建一个新副本并修改
// 如果 oldNextPtr 为 nil,说明是第一次设置或目标为空
var newCount uint
if oldNextPtr != nil {
newCount = oldNextPtr.count + 1 // 假设我们要增加计数器
} else {
newCount = 1 // 初始计数
}
newNextPtr := &pointer_t{
ptr: newNodeVal, // 更新内部的 *node_t
count: newCount,
}
// 3. 尝试原子替换 targetNode.next 指针
// 这里我们直接操作 targetNode.next 字段
if atomic.CompareAndSwapPointer(
(*unsafe.Pointer)(unsafe.Pointer(&targetNode.next)),
unsafe.Pointer(oldNextPtr),
unsafe.Pointer(newNextPtr),
) {
return // 成功更新
}
// 否则,CAS失败,循环重试
}
}在实际的并发编程中,尤其是实现无锁数据结构时,这两种策略都有其用武之地。例如,一个Go语言实现的无锁链表项目(如tux21b/goco/list.go)就很好地展示了如何利用atomic.CompareAndSwapPointer来构建复杂的无锁结构。
该项目中引入了一个MarkAndRef结构体,它与我们讨论的pointer_t结构体非常相似,但它存储的是一个bool类型(用于标记节点是否被删除)和一个指针。这个结构体的设计是为了解决并发删除和插入操作中的ABA问题,确保在节点被标记删除后,不会被错误地重新插入。通过原子地替换指向MarkAndRef结构体的指针,它有效地实现了对复合状态的原子更新。
对于希望深入理解和构建自身无锁数据结构的开发者来说,参考goco/list.go的实现是一个极佳的起点。它不仅展示了atomic.CompareAndSwapPointer的实际应用,也提供了处理复杂并发场景的宝贵经验。
Go语言中对复合结构体执行原子CAS操作是一个常见的挑战。位窃取和写时复制(COW)是两种有效的解决方案,各有优劣。位窃取适用于需要极高性能且元数据量极小的情况,但其实现复杂且具有平台依赖性。而写时复制则更具通用性,适用于各种复杂度的结构体,但会引入额外的内存分配和垃圾回收开销。
在选择具体策略时,应综合考虑应用的性能要求、内存限制、代码复杂度和可维护性。对于大多数场景,写时复制模式通常是更安全、更易于理解和维护的选择。而对于对性能有极致要求的特定场景,且元数据量极小,位窃取则可能提供更高的效率。理解并灵活运用这些技术,是构建高性能、高并发Go应用程序的关键。
以上就是Go并发编程中结构体原子比较与交换的实现策略的详细内容,更多请关注php中文网其它相关文章!
编程怎么学习?编程怎么入门?编程在哪学?编程怎么学才快?不用担心,这里为大家提供了编程速学教程(入门课程),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号