Linux如何监控内核性能？_Linuxperf工具分析与应用-LINUX-PHP中文网

linux内核性能监控的核心工具是perf。1. perf提供了硬件、软件及内核事件的多维度监控，能精准定位性能瓶颈；2. 它包含perf stat用于高层性能概览，perf record记录性能事件生成数据文件，perf report解析并展示详细性能信息；3. perf top提供实时性能视图，可结合-c参数观察特定cpu核心状态；4. perf支持跟踪系统调用、上下文切换等具体事件，还可通过动态探针（kprobes/uprobes）监控任意函数或指令；5. 通过perf script配合flamegraph生成火焰图，实现性能数据可视化，直观呈现热点函数及其调用链；6. 高级功能如perf annotate可映射性能数据至源码或汇编级别，perf probe则可用于调试无预定义埋点的场景。这些功能共同构成了全面、深入的性能分析体系。

Linux如何监控内核性能？_Linuxperf工具分析与应用

Linux内核性能监控的核心工具无疑是

perf

登录后复制

。它提供了一个深入操作系统内核的窗口，让我们能够观察到硬件、软件以及内核事件的细微之处，从而定位性能瓶颈。这不仅仅是一个命令，更是一种理解系统运行状态的哲学。

解决方案

要监控Linux内核性能，首先想到的就是使用

perf

登录后复制

工具集。它通常随内核源码或发行版软件包提供，是Linux系统性能分析的瑞士军刀。

最基础的用法，你可以通过

perf stat

登录后复制

来获得一个高层级的性能概览，比如CPU周期、指令数、缓存命中率等。这就像是给系统做个体检，快速了解哪些指标可能不健康。

perf stat -a sleep 5

登录后复制

这条命令会统计整个系统在5秒内的性能事件。

-a

登录后复制

表示系统范围，

sleep 5

登录后复制

只是为了提供一个运行时间窗口。

如果需要更细致的分析，比如想知道某个特定程序或系统在运行期间，哪些函数占用了大量CPU时间，或者导致了频繁的缓存失效，那么

perf record

登录后复制

就派上用场了。它会记录下选定的性能事件，生成一个

perf.data

登录后复制

文件。

perf record -F 99 -g -- ls

登录后复制

这里

-F 99

登录后复制

表示每秒采样99次（一个非整数可以避免与系统调度器对齐），

-g

登录后复制

则会记录调用栈信息，这对于生成火焰图至关重要。

-- ls

登录后复制

表示对

ls

登录后复制

命令的执行进行采样。

记录完数据后，使用

perf report

登录后复制

来解析

perf.data

登录后复制

文件，以交互式界面展示性能数据。

perf report

登录后复制

此外，

perf top

登录后复制

可以提供一个类似

top

登录后复制

命令的实时性能视图，显示当前哪些函数或进程正在消耗最多的CPU资源。

perf top

登录后复制

这些只是

perf

登录后复制

的冰山一角，但它们构成了我们深入内核性能分析的基础。

perf

登录后复制

工具到底能看些什么？深入了解其监控维度

perf

登录后复制

的强大之处在于它能从多个维度捕获性能事件，这远不止CPU利用率那么简单。在我看来，它更像是一个多光谱的扫描仪，能穿透表象，揭示系统深层的工作机制。

首先是硬件性能计数器事件（Hardware Performance Counters, HPCs）。这些事件直接由CPU硬件提供，比如CPU周期（

cpu-cycles

登录后复制

）、指令数（

instructions

登录后复制

）、缓存引用（

cache-references

登录后复制

）、缓存未命中（

cache-misses

登录后复制

）、分支预测失误（

branch-misses

登录后复制

）等等。通过这些，你能知道你的程序是CPU密集型还是内存密集型，是否存在大量的缓存失效导致性能下降。很多时候，我们以为代码逻辑慢，结果发现是内存访问模式不佳，导致CPU一直在等待数据。

其次是软件事件（Software Events）。这些事件由内核提供，反映了内核层面的活动，比如上下文切换（

context-switches

登录后复制

）、页面错误（

page-faults

登录后复制

）、CPU迁移（

cpu-migrations

登录后复制

）等。如果你的程序上下文切换非常频繁，那可能意味着它在等待I/O或者被调度器频繁切换，而不是在做有效计算。

再来是内核跟踪点（Kernel Tracepoints）。这是内核中预定义的埋点，用于跟踪特定的内核行为，例如系统调用（

syscalls

登录后复制

）、进程调度（

sched

登录后复制

）、文件I/O（

block

登录后复制

）等。比如，你可以用

perf

登录后复制

来跟踪所有

open

登录后复制

系统调用的发生，看看哪些文件被频繁打开，或者哪个进程导致了大量的磁盘I/O。这对于理解应用程序与内核的交互模式非常有帮助。

最后，还有动态探针（Kprobes/Uprobes）。这是

perf

登录后复制

最灵活也最强大的功能之一。你可以通过

perf probe

登录后复制

在内核函数或用户空间程序的任意指令地址设置动态探针，监控特定的变量值或函数调用。这就像是外科医生在手术中精确地放置传感器，只为了观察最关键的指标。比如，我想知道某个内核网络函数在什么情况下被调用，传入了什么参数，就可以用Kprobe来做。

这些不同维度的事件结合起来，就构成了一个完整的性能画像。它不只是告诉你“慢”，而是告诉你“为什么慢”，慢在CPU等待数据，还是慢在频繁的上下文切换，亦或是慢在大量的系统调用。

掌握

perf

登录后复制

命令：从入门到实践的常用操作与案例

掌握

perf

登录后复制

命令，就像是学会了驾驶一辆高性能跑车，你得知道每个档位和踏板的作用。这里分享一些我个人觉得在日常工作中非常实用的

perf

登录后复制

操作和一些案例。

最常用的，也是我每次遇到性能问题会先跑的，是针对整个系统的

perf stat

登录后复制

：

perf stat -a -r 5 sleep 10

登录后复制

-r 5

登录后复制

表示重复运行5次，取平均值。这样可以减少单次运行的偶然性。输出会包含CPU周期、指令数、分支预测失误率、缓存命中率等，这些数据能快速帮你判断系统是CPU瓶颈、内存瓶颈还是I/O瓶颈。如果

instructions per cycle (IPC)

登录后复制

很低，那可能意味着CPU在等待数据或分支预测失误很多。

接下来是针对特定进程的采样。比如，你有一个服务进程ID是12345，想看它在忙什么：

AppMall应用商店

AI应用商店，提供即时交付、按需付费的人工智能应用服务

查看详情

perf record -F 99 -g -p 12345 sleep 30

登录后复制

-p 12345

登录后复制

指定进程ID。记录30秒后，用

perf report

登录后复制

查看。在

perf report

登录后复制

的交互界面里，你可以按

登录后复制

键切换到按注释（annotate）模式，查看具体函数的热点代码，甚至能看到汇编指令级别哪个地方耗时最多，这对于优化热点代码非常有帮助。

如果你想实时观察某个CPU核上的情况，

perf top

登录后复制

可以加上

-C

登录后复制

参数：

perf top -C 0

登录后复制

这会显示CPU 0上当前最活跃的函数。当你在排查某个CPU核负载异常高的问题时，这个命令就很有用了。

有时候，你可能想知道在某个特定的系统调用上花费了多少时间。比如，

read

登录后复制

系统调用：

perf record -e 'syscalls:sys_enter_read' -a sleep 5

登录后复制

这会记录所有

read

登录后复制

系统调用的进入事件。当然，你也可以记录

syscalls:sys_exit_read

登录后复制

来计算其执行时间。这种细粒度的事件跟踪，能让你精确地定位到是哪个系统调用成为了瓶颈。

再举个例子，我曾经遇到一个网络服务，在高峰期性能急剧下降。我怀疑是连接接受或处理的问题。于是我用了

perf

登录后复制

来跟踪

accept

登录后复制

系统调用：

perf record -e 'syscalls:sys_enter_accept4' -a sleep 10
perf report

登录后复制

通过

perf report

登录后复制

，我发现

accept4

登录后复制

的调用频率非常高，而且每次调用后的处理函数调用栈也很深。结合代码分析，最终发现是连接池管理不当，导致频繁地创建和销毁连接，而非复用，从而引发了性能问题。

这些操作的组合，能够让你从宏观到微观，逐步缩小问题范围，最终找到真正的性能瓶颈。

perf

登录后复制

数据可视化与高级分析：让性能瓶颈无所遁形

单纯的文本报告，有时候让人看得眼花缭乱，尤其是在调用栈很深的时候。所以，将

perf

登录后复制

数据可视化，是让性能瓶颈无所遁形的关键一步。我个人最喜欢，也觉得最有用的，就是火焰图（Flame Graph）。

火焰图是一种非常直观的性能分析可视化工具。它将采样到的调用栈信息，以图形化的方式展现出来，每个矩形代表一个函数，宽度表示该函数在总采样中的占比，堆叠的矩形则表示调用关系。

要生成火焰图，你需要先用

perf record

登录后复制

记录带调用栈的数据，然后结合Brendan Gregg的

FlameGraph

登录后复制

工具集。

记录数据（确保带-g参数）
```
perf record -F 99 -g -a sleep 60
```
登录后复制
```
-a
```
登录后复制
表示系统全局采样，
```
sleep 60
```
登录后复制
是采样时长。
生成
```
perf script
```
登录后复制
输出
```
perf script
```
登录后复制
会将
```
perf.data
```
登录后复制
文件中的二进制数据转换为可读的文本格式，包含调用栈信息。
```
perf script > out.perf
```
登录后复制
使用
```
FlameGraph
```
登录后复制
工具集生成火焰图 这通常需要
```
stackcollapse-perf.pl
```
登录后复制
和
```
flamegraph.pl
```
登录后复制
这两个Perl脚本。
```
# 下载FlameGraph工具集，例如到 /opt/FlameGraph
# git clone https://github.com/brendangregg/FlameGraph.git /opt/FlameGraph

cat out.perf | /opt/FlameGraph/stackcollapse-perf.pl | /opt/FlameGraph/flamegraph.pl > kernel_performance.svg
```
登录后复制
生成的
```
kernel_performance.svg
```
登录后复制
是一个SVG图像文件，可以用浏览器打开。在火焰图中，越宽的矩形表示该函数或其子函数消耗的CPU时间越多。你可以点击矩形来放大，深入查看某个调用路径。

火焰图的强大之处在于，它能让你一眼看出哪些函数是“热点”，以及这些热点函数是在哪个调用链上被频繁调用的。它能清晰地展示出CPU时间的消耗分布，帮助你快速定位到那些真正拖慢系统性能的代码路径。

除了火焰图，

perf

登录后复制

本身也提供了一些高级分析功能。例如，

perf annotate

登录后复制

可以在

perf report

登录后复制

中按

登录后复制

键进入，它能把性能数据映射回源代码或汇编代码，显示每行代码的性能贡献。这对于深入理解特定函数内部的性能瓶颈非常有用。

# 在 perf report 界面中，选中一个函数后按 'a' 键

登录后复制

再比如，

perf probe

登录后复制

允许你动态地在内核函数或用户空间程序中设置探针，这对于调试和分析那些没有预定义跟踪点的场景非常有用。

# 探测内核函数 tcp_sendmsg 的入口，并打印其参数
perf probe tcp_sendmsg
perf record -e probe:tcp_sendmsg -a sleep 10
perf script

登录后复制

高级分析不仅仅是工具的使用，更是一种思维方式。它要求你不仅仅看到数据，更要理解数据背后的系统行为。一个函数在火焰图上很宽，并不一定意味着它本身写得不好，可能只是因为它被一个非常频繁的循环调用了，或者它在等待某个资源。所以，结合代码逻辑、系统架构和

perf

登录后复制

数据进行综合判断，才是解决问题的关键。这就像是侦探破案，每个线索都很重要，但最终的真相需要所有线索的串联和推理。

以上就是Linux如何监控内核性能？_Linuxperf工具分析与应用的详细内容，更多请关注php中文网其它相关文章！

大家都在看：

LINUX如何设置PATH环境变量使其永久生效_Linux环境变量配置技巧 LINUX如何设置SSH免密登录_LINUX SSH免密码登录配置步骤 LINUX怎么查询一个文件是由哪个包安装的_Linux查询文件所属软件包方法 LINUX怎么使用tcpdump抓取网络包_Linux Tcpdump抓取网络包方法 LINUX怎么对文件内容进行排序_Linux文件内容排序方法

Linux如何监控内核性能？_Linuxperf工具分析与应用

解决方案

perf
登录后复制
工具到底能看些什么？深入了解其监控维度

掌握
perf
登录后复制
命令：从入门到实践的常用操作与案例

perf
登录后复制
数据可视化与高级分析：让性能瓶颈无所遁形

大家都在看：

Linux如何监控内核性能？_Linuxperf工具分析与应用

解决方案

perf登录后复制工具到底能看些什么？深入了解其监控维度

掌握perf登录后复制命令：从入门到实践的常用操作与案例

perf登录后复制数据可视化与高级分析：让性能瓶颈无所遁形

大家都在看：

perf
登录后复制
工具到底能看些什么？深入了解其监控维度

掌握
perf
登录后复制
命令：从入门到实践的常用操作与案例

perf
登录后复制
数据可视化与高级分析：让性能瓶颈无所遁形