
本文深入探讨Go语言中的扇入(Fan-In)并发模式,并解释为何在特定情况下其输出可能呈现顺序性。我们将分析Go调度器与GOMAXPROCS的作用,揭示默认GOMAXPROCS=1如何影响goroutine的执行表现。通过调整GOMAXPROCS和增加实验迭代次数,读者将学会如何正确观察并理解Go程序中的并发与并行行为,避免对并发模式的误解。
Go语言以其内置的并发原语——goroutine和channel——而闻名,这些原语使得编写并发程序变得简单高效。扇入(Fan-In)模式是Go并发编程中一个常见的模式,其核心思想是将来自多个并发源(通常是多个channel)的数据汇聚到一个单一的channel中。这使得下游消费者可以从一个统一的接口接收数据,而无需关心数据的具体来源。
以下是一个经典的扇入模式实现,它模拟了两个“无聊”的说话者(Joe和Ann)不断地发送消息:
package main
import (
"fmt"
"math/rand"
"runtime"
"time"
)
// boring 函数模拟一个持续发送消息的goroutine
func boring(msg string) <-chan string {
c := make(chan string)
go func() {
for i := 0; ; i++ {
c <- fmt.Sprintf("%s %d", msg, i)
time.Sleep(time.Duration(rand.Intn(1e3)) * time.Millisecond) // 随机延迟
}
}()
return c
}
// fanIn 函数实现扇入模式,将两个输入channel的数据合并到一个输出channel
func fanIn(in1, in2 <-chan string) <-chan string {
c := make(chan string)
go func() {
for {
c <- <-in1 // 从in1接收数据并发送到c
}
}()
go func() {
for {
c <- <-in2 // 从in2接收数据并发送到c
}
}()
return c
}
func main() {
// 打印当前CPU核心数,并设置GOMAXPROCS
fmt.Println("NumCPU:", runtime.NumCPU())
runtime.GOMAXPROCS(runtime.NumCPU()) // 显式设置GOMAXPROCS
c := fanIn(boring("Joe"), boring("Ann")) // 启动两个boring goroutine,并通过fanIn合并
for i := 0; i < 10; i++ {
fmt.Println(<-c) // 从合并后的channel接收并打印10条消息
}
fmt.Println("You're both boring: I'm leaving")
}这段代码的预期行为是,由于Joe和Ann是并发运行的,并且它们的发送间隔是随机的,所以从c接收到的消息顺序应该是随机交错的,例如:Joe 0, Ann 0, Ann 1, Joe 1, Joe 2, Ann 2...。然而,在某些情况下,我们可能会观察到如下的顺序输出:
NumCPU: 4 Joe 0 Ann 0 Joe 1 Ann 1 Joe 2 Ann 2 ...
这种现象可能会让初学者感到困惑,认为并发模式并未生效。
要理解上述顺序输出的原因,我们需要深入了解Go语言的运行时调度器(scheduler)以及GOMAXPROCS环境变量的作用。
GOMAXPROCS是一个环境变量或通过runtime.GOMAXPROCS函数设置的参数,它控制Go运行时可以同时使用的操作系统线程(OS thread)的最大数量来执行Go goroutine。这些OS线程被称为“处理器”(P)。Go调度器负责将用户创建的goroutine映射到这些可用的P上。
在Go 1.5版本之前,GOMAXPROCS的默认值是1。这意味着即使你的机器有多个CPU核心,Go程序默认也只会使用一个OS线程。在这种配置下,goroutine的调度行为往往会显得非常确定和顺序,尤其是在短时间运行或I/O操作较少的情况下。
自Go 1.5版本起,GOMAXPROCS的默认值变更为runtime.NumCPU(),即默认会使用机器上所有可用的CPU核心。因此,对于现代Go版本,通常不再需要显式设置runtime.GOMAXPROCS(runtime.NumCPU())。然而,对于较旧的Go版本或特定的实验环境(如Go Playground),显式设置仍然是必要的。
当GOMAXPROCS=1时,Go调度器在单个OS线程上进行goroutine调度。对于fanIn模式中的两个无限循环go func() {for {c <- <-in1}}()和go func() {for {c <- <-in2}}(),调度器可能会以一种非常一致和可预测的方式在它们之间切换,例如,总是先执行in1的发送,再执行in2的发送,然后重复。这就导致了我们观察到的顺序输出。
为了在多核CPU上实现真正的并行执行并观察到随机交错的输出,你需要确保GOMAXPROCS被设置为大于1的值。最常见且推荐的做法是将其设置为CPU的核心数:
func main() {
fmt.Println("NumCPU:", runtime.NumCPU())
// 确保Go运行时可以使用所有可用的CPU核心
runtime.GOMAXPROCS(runtime.NumCPU())
c := fanIn(boring("Joe"), boring("Ann"))
for i := 0; i < 10; i++ {
fmt.Println(<-c)
}
fmt.Println("You're both boring: I'm leaving")
}通过上述修改,在支持多核的系统上运行,你将更有可能看到随机交错的输出。
除了GOMAXPROCS的设置,另一个影响并发行为观察的关键因素是程序的运行时间或循环迭代次数。即使在GOMAXPROCS=1的情况下,Go调度器仍然会在goroutine之间进行上下文切换,实现并发。然而,如果程序运行时间很短(例如,只循环10次),那么调度器可能还没有足够的机会展示其“随机性”或非确定性。
正如原始问题中的发现,当我们将主循环的迭代次数从10增加到更大的值(例如40或更多)时,即使不显式设置GOMAXPROCS(即使用默认值1),也可能观察到输出顺序的随机变化。
func main() {
fmt.Println("NumCPU:", runtime.NumCPU())
// 在Go 1.5+版本中,GOMAXPROCS默认为NumCPU(),这里可以省略
// runtime.GOMAXPROCS(runtime.NumCPU()) // 对于旧版本或特定环境,仍然建议保留
c := fanIn(boring("Joe"), boring("Ann"))
// 增加循环次数,更容易观察到非确定性行为
for i := 0; i < 40; i++ { // 将10改为40或更大
fmt.Println(<-c)
}
fmt.Println("You're both boring: I'm leaving")
}原因分析: 在GOMAXPROCS=1的单线程环境下,调度器会以非常快的速度在goroutine之间切换。对于一个非常短的循环,调度器可能每次都以相同的顺序(例如,先执行goroutine A,再执行goroutine B)完成所有的操作。但当循环次数增加时,goroutine的随机延迟(time.Sleep(time.Duration(rand.Intn(1e3)) * time.Millisecond))以及调度器的内部决策(例如,垃圾回收、系统调用等)将有更多机会引入非确定性,从而打破严格的顺序性,使得输出开始随机交错。
这表明,并发(concurrency)和并行(parallelism)是两个不同的概念:
总结: Go语言的扇入模式是处理多个并发源的强大工具。然而,理解Go调度器的工作原理和GOMAXPROCS参数的重要性是正确观察和调试并发行为的关键。通过显式设置runtime.GOMAXPROCS(runtime.NumCPU())(尤其是在Go 1.5之前的版本或特定环境中),并确保有足够的运行时间或迭代次数,我们就能充分体验Go goroutine的并发与并行能力,并避免对程序行为的误解。
以上就是Go并发模式:深入理解扇入、调度器与GOMAXPROCS的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号