首页 > 后端开发 > Golang > 正文

Go Goroutine并发:理解与启用真正的并行处理

DDD
发布: 2025-09-28 13:18:01
原创
758人浏览过

Go Goroutine并发:理解与启用真正的并行处理

本文深入探讨Go语言中goroutine的并发执行机制,特别是当goroutine数量多于默认处理器核心数时,如何通过runtime.GOMAXPROCS确保任务在多核CPU上实现真正的并行处理。文章通过冒泡排序示例,解释了goroutine看似同步完成的现象,并指导如何配置运行时参数以优化并行性能,实现预期的独立任务加速。

1. Go Goroutine并发执行的挑战

go语言中,goroutine是轻量级的并发执行单元。开发者通常期望启动多个goroutine后,它们能够独立并行运行,尤其是当任务负载不同时,轻量级任务应更快完成。然而,实际观察到的行为有时并非如此,例如,多个goroutine在处理不同大小的数据集时,其“完成”消息可能几乎同时出现,这让人误以为它们在相互等待。

考虑以下冒泡排序的例子,其中启动了三个goroutine,分别对不同大小的切片进行排序:

package main

import (
    "fmt"
    "math/rand"
    "time"
)

/* 简单的冒泡排序算法 */
func bubblesort(str string, a []int) []int {
    for n := len(a); n > 1; n-- {
        for i := 0; i < n-1; i++ {
            if a[i] > a[i+1] {
                a[i], a[i+1] = a[i+1], a[i] // 交换
            }
        }
    }
    fmt.Println(str + " done") // 完成消息
    return a
}

/* 用伪随机数填充切片 */
func random_fill(a []int) []int {
    for i := 0; i < len(a); i++ {
        a[i] = rand.Int()
    }
    return a
}

func main() {
    rand.Seed(time.Now().UTC().UnixNano()) // 设置随机数种子

    a1 := make([]int, 34589) // 创建切片
    a2 := make([]int, 42)    // 创建切片
    a3 := make([]int, 9999)  // 创建切片

    a1 = random_fill(a1) // 填充切片
    a2 = random_fill(a2) // 填充切片
    a3 = random_fill(a3) // 填充切片
    fmt.Println("Slices filled ...")

    go bubblesort("Thread 1", a1) // 1. Goroutine 启动
    go bubblesort("Thread 2", a2) // 2. Goroutine 启动
    go bubblesort("Thread 3", a3) // 3. Goroutine 启动
    fmt.Println("Main working ...")

    time.Sleep(1 * time.Minute) // 等待1分钟以接收"done"消息
}
登录后复制

在某些环境下运行上述代码,可能会得到如下输出:

Slices filled ...
Main working ...
Thread 1 done
Thread 2 done
Thread 3 done
登录后复制

尽管 a2 切片最小(42个元素),a3 次之(9999个元素),a1 最大(34589个元素),但“done”消息却几乎同时出现,或者顺序不确定,且不总是反映任务的实际完成时间。这并非goroutine在相互等待,而是Go运行时调度器在默认配置下,可能没有充分利用多核CPU的并行能力。

2. Go调度器与GOMAXPROCS

Go语言的并发模型是基于M:N调度器实现的,它将M个goroutine调度到N个操作系统线程上执行。默认情况下,Go运行时会尝试利用所有可用的CPU核心。然而,在Go 1.5版本之前,runtime.GOMAXPROCS 的默认值是1,这意味着Go程序在任何给定时刻最多只能有一个操作系统线程在执行Go代码,即使系统有多个CPU核心,goroutine也只能通过时间片轮转的方式并发执行,而非真正的并行。

要强制Go运行时在多个CPU核心上并行执行goroutine,需要显式地设置 runtime.GOMAXPROCS。这个函数用于设置可以同时执行Go代码的操作系统线程的最大数量。

3. 实现真正的并行:配置GOMAXPROCS

为了让Go程序充分利用多核CPU,实现goroutine的真正并行,可以在 main 函数的开头调用 runtime.GOMAXPROCS。

package main

import (
    "fmt"
    "math/rand"
    "runtime" // 导入 runtime 包
    "time"
)

/* 简单的冒泡排序算法 */
func bubblesort(str string, a []int) []int {
    for n := len(a); n > 1; n-- {
        for i := 0; i < n-1; i++ {
            if a[i] > a[i+1] {
                a[i], a[i+1] = a[i+1], a[i] // 交换
            }
        }
    }
    fmt.Println(str + " done") // 完成消息
    return a
}

/* 用伪随机数填充切片 */
func random_fill(a []int) []int {
    for i := 0; i < len(a); i++ {
        a[i] = rand.Int()
    }
    return a
}

func main() {
    // 设置 Go 运行时可以使用的最大操作系统线程数
    // 这里设置为2,表示最多两个OS线程可以同时执行Go代码
    // 也可以设置为 runtime.NumCPU() 来使用所有可用的CPU核心
    runtime.GOMAXPROCS(2) 

    rand.Seed(time.Now().UTC().UnixNano()) // 设置随机数种子

    a1 := make([]int, 34589) // 创建切片
    a2 := make([]int, 42)    // 创建切片
    a3 := make([]int, 9999)  // 创建切片

    a1 = random_fill(a1) // 填充切片
    a2 = random_fill(a2) // 填充切片
    a3 = random_fill(a3) // 填充切片
    fmt.Println("Slices filled ...")

    go bubblesort("Thread 1", a1) // 1. Goroutine 启动
    go bubblesort("Thread 2", a2) // 2. Goroutine 启动
    go bubblesort("Thread 3", a3) // 3. Goroutine 启动
    fmt.Println("Main working ...")

    time.Sleep(1 * time.Minute) // 等待1分钟以接收"done"消息
}
登录后复制

修改后的代码,在执行时,由于 runtime.GOMAXPROCS(2) 的设置,Go调度器现在可以同时在两个操作系统线程上执行goroutine。这意味着,如果系统有至少两个核心,那么两个goroutine可以真正并行运行。预期输出将反映任务负载的差异:

用Apache Spark进行大数据处理
用Apache Spark进行大数据处理

本文档主要讲述的是用Apache Spark进行大数据处理——第一部分:入门介绍;Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。 在这个Apache Spark文章系列的第一部分中,我们将了解到什么是Spark,它与典型的MapReduce解决方案的比较以及它如何为大数据处理提供了一套完整的工具。希望本文档会给有需要的朋友带来帮助;感

用Apache Spark进行大数据处理 0
查看详情 用Apache Spark进行大数据处理
Slices filled ...
Main working ...
Thread 2 done  // 最小的切片最先完成
Thread 3 done  // 中等大小的切片次之
Thread 1 done  // 最大的切片最后完成
登录后复制

4. 注意事项与最佳实践

  1. runtime.GOMAXPROCS 的默认值:

    • Go 1.5及更高版本中,runtime.GOMAXPROCS 的默认值已更改为 runtime.NumCPU(),即默认情况下Go程序会尝试使用所有可用的CPU核心进行并行处理。因此,对于新版本的Go,通常无需显式设置 runtime.GOMAXPROCS 就能获得并行优势。
    • 如果您的Go版本较老(低于1.5),或者您希望限制Go运行时使用的核心数量,那么显式调用 runtime.GOMAXPROCS 仍然是必要的。
  2. 选择 GOMAXPROCS 的值:

    • 通常,将其设置为 runtime.NumCPU() 是一个好的实践,这样Go程序就能充分利用机器的所有物理核心。
    • 在某些特定场景下,例如,当程序同时执行大量I/O操作(I/O密集型)时,GOMAXPROCS 的值可能需要根据实际情况进行调整,甚至可以略大于 runtime.NumCPU(),以允许在等待I/O时调度器切换到其他goroutine。然而,对于CPU密集型任务,通常不建议将其设置得远大于核心数,因为过多的OS线程切换会引入额外的开销。
  3. Goroutine的调度顺序:

    • 即使设置了 runtime.GOMAXPROCS,Go调度器对goroutine的执行顺序仍然不提供任何保证。上述示例中,Thread 2 最先完成是因为其任务量最小,而不是因为调度器优先选择了它。
    • 如果需要控制goroutine的执行顺序或等待所有goroutine完成,应使用 sync.WaitGroup、channel 等并发原语,而不是依赖 time.Sleep 这种粗糙的等待方式。
  4. time.Sleep 的副作用:

    • 在 bubblesort 函数中添加 time.Sleep(1) 会强制调度器进行上下文切换,从而可能使小任务在等待时让出CPU给其他goroutine,导致看起来任务是并行完成的。但这会引入不必要的延迟,并不能真实反映算法的执行效率。

总结

理解Go语言的并发模型和调度器行为对于编写高性能的并发程序至关重要。通过正确配置 runtime.GOMAXPROCS(尤其是在Go 1.5之前的版本或需要特定控制的场景),我们可以确保Go程序能够充分利用多核CPU的并行能力,从而让goroutine在独立任务中真正实现并行加速,并获得预期的性能表现。同时,应结合 sync.WaitGroup 等工具,更优雅地管理goroutine的生命周期和同步。

以上就是Go Goroutine并发:理解与启用真正的并行处理的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号