
go 语言中的切片(slice)是一个动态数组的视图,它包含指向底层数组的指针、长度(len)和容量(cap)。当使用内置的 append 函数向切片添加元素时,如果当前容量不足以容纳新元素,append 函数就需要重新分配一个更大的底层数组。
Go 语言规范对此行为有明确规定:
如果 s 的容量不足以容纳附加值,append 会分配一个新的、足够大的切片,以容纳现有切片元素和附加值。因此,返回的切片可能引用不同的底层数组。
这表明 append 函数在容量不足时会进行内存重新分配和数据复制。关键在于,这种重新分配的策略决定了 append 的计算复杂度。
Go 语言的 gc 编译器实现中,append 函数通过一种“慷慨”的策略来增长切片的容量,从而实现了摊还常数时间复杂度。这意味着,虽然单个 append 操作在需要重新分配时可能耗时较长(因为它涉及内存分配和数据复制),但在一系列 append 操作的平均意义上,每个操作的成本是常数级的。
这种策略的核心在于 growslice 函数,它位于 Go 运行时(runtime)包的 slice.go 源文件中。其容量增长逻辑大致如下:
newcap := old.cap
doublecap := newcap + newcap // 尝试将容量翻倍
if cap > doublecap { // 如果所需容量大于翻倍后的容量,则直接使用所需容量
newcap = cap
} else {
if old.len < 1024 { // 如果旧长度小于1024,则容量直接翻倍
newcap = doublecap
} else { // 如果旧长度大于等于1024,则每次增加25%的容量,直到满足所需
for newcap < cap {
newcap += newcap / 4
}
}
}从上述代码可以看出,当切片长度较小(< 1024)时,容量会直接翻倍增长。当切片长度较大时,容量会以 1.25 倍的速度增长。这种策略确保了在大多数情况下,即使需要重新分配,新分配的容量也远大于当前所需,从而减少了后续重新分配的频率。
值得注意的是,Go 语言规范允许 append 函数有多种实现方式。规范只要求新分配的切片“足够大”,但并未强制规定具体的增长策略。这意味着:
因此,append 函数的实际性能取决于其底层实现。幸运的是,主流的 Go gc 编译器采用了高效的慷慨分配策略。
为了直观地理解不同分配策略对 append 性能的影响,我们可以模拟两种 append 实现:一种是慷慨分配(constant),另一种是节俭分配(variable)。
package main
import "fmt"
// Generous reallocation: 模拟 Go gc 编译器的慷慨分配策略
// 目标是实现摊还常数时间复杂度
func constant(s []int, x ...int) []int {
if len(s)+len(x) > cap(s) { // 容量不足时进行扩容
newcap := len(s) + len(x) // 至少需要的新容量
m := cap(s) // 当前容量
if m+m < newcap { // 如果翻倍容量不足以容纳所需,直接使用所需容量
m = newcap
} else {
for { // 否则,根据长度进行倍增或1.25倍增长
if len(s) < 1024 {
m += m // 小于1024时,容量翻倍
} else {
m += m / 4 // 大于等于1024时,容量增加25%
}
if !(m < newcap) { // 直到新容量足够
break
}
}
}
tmp := make([]int, len(s), m) // 创建新切片,容量为m
copy(tmp, s) // 复制旧数据
s = tmp // 更新切片引用
}
// 理论上不会发生,因为上面已经确保了容量
if len(s)+len(x) > cap(s) {
panic("unreachable")
}
return append(s, x...) // 使用内置append完成添加(这里为了简化,实际应该手动添加)
}
// Parsimonious reallocation: 模拟节俭分配策略
// 每次只分配刚好满足当前需求的容量,可能导致线性时间复杂度
func variable(s []int, x ...int) []int {
if len(s)+len(x) > cap(s) { // 容量不足时进行扩容
// 每次只分配刚好能容纳所有元素的容量
tmp := make([]int, len(s), len(s)+len(x))
copy(tmp, s) // 复制旧数据
s = tmp // 更新切片引用
}
// 理论上不会发生
if len(s)+len(x) > cap(s) {
panic("unreachable")
}
return append(s, x...) // 使用内置append完成添加
}
func main() {
s := []int{0, 1, 2}
x := []int{3, 4}
fmt.Println("data ", len(s), cap(s), s, len(x), cap(x), x)
a, c, v := s, s, s // 初始化三个切片,分别用于测试内置append、慷慨分配和节俭分配
// 循环添加元素,观察容量变化
for i := 0; i < 4096; i++ {
a = append(a, x...) // 使用内置 append
c = constant(c, x...) // 使用慷慨分配模拟
v = variable(v, x...) // 使用节俭分配模拟
}
fmt.Println("append ", len(a), cap(a), len(x))
fmt.Println("constant", len(c), cap(c), len(x))
fmt.Println("variable", len(v), cap(v), len(x))
}运行上述代码,我们可以观察到以下输出(以 gc 编译器为例):
data 3 3 [0 1 2] 2 2 [3 4] append 8195 9152 2 constant 8195 9152 2 variable 8195 8195 2
输出分析:
这个例子清晰地展示了慷慨分配策略如何通过预留额外容量来优化性能,使其在长期操作中达到摊还常数时间复杂度,而节俭分配则可能导致更频繁的重新分配,从而降低效率。
总而言之,Go 语言的 append 函数在 gc 编译器下通过其智能的容量增长策略,实现了摊还常数时间复杂度。这种设计在大多数实际应用中提供了高效且可预测的性能,使得 Go 语言在处理动态数据集合时表现出色。开发者在日常编程中无需过度担心 append 的性能开销,但了解其底层机制有助于更好地优化代码。
以上就是深入理解 Go 语言 append 函数的计算复杂度的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号