如何在Linux系统中监控磁盘空间使用情况？实用工具和命令的详细解析-LINUX-PHP中文网

使用df和du命令可监控Linux磁盘空间，df -h查看分区使用情况，du -sh分析目录占用，ncdu提供交互式界面，结合find查找大文件，logrotate管理日志轮转，并通过Shell脚本定时检查使用率，设置邮件预警，或使用Prometheus、Zabbix等工具实现自动化监控与告警，避免磁盘耗尽导致系统故障。

如何在linux系统中监控磁盘空间使用情况？实用工具和命令的详细解析

在Linux系统里，监控磁盘空间使用情况，说白了，就是得知道哪些地方快满了，或者哪些文件、目录正在“吞噬”你的硬盘。最直接、最常用的手段，离不开

df

登录后复制

和

du

登录后复制

这两个命令，它们就像你的左膀右臂，一个看全局，一个查细节。当然，还有些更高级、更友好的工具，能让你把这事儿处理得更得心应手，避免那种突然发现系统卡顿、服务挂掉，一查才发现是磁盘爆满的尴尬局面。

解决方案

要深入了解Linux系统的磁盘空间，我们通常会用到几个核心工具。这些工具各有侧重，但结合起来就能形成一个完整的监控链条。

首先，最基础的，也是我个人最常用到的，是

df

登录后复制

命令（disk free）。它能让你快速瞥一眼整个文件系统的使用情况。我通常会这样用：

df -h

登录后复制

df -h

登录后复制

的

-h

登录后复制

参数非常关键，它会把文件大小显示成人类可读的格式（比如10G、200M），而不是一堆难以理解的字节数。你会看到文件系统、总大小、已用空间、可用空间、使用百分比，以及挂载点。这一下，哪个分区快满了，一目了然。比如，我曾经就遇到过

/var

登录后复制

分区因为日志文件疯狂增长而爆满的情况，导致一些服务无法启动，当时就是

df -h

登录后复制

帮我迅速定位了问题。

但

df

登录后复制

的局限性在于，它只告诉你文件系统整体的使用情况，如果你想知道是哪个目录或者哪个文件占用了大量空间，它就帮不上忙了。这时候，就轮到

du

登录后复制

命令（disk usage）登场了。

du

登录后复制

命令是用来估算文件或目录所占磁盘空间的。它的用法很多样，我最常用的一个场景是，当

df

登录后复制

告诉我某个分区快满了，我就会进入那个分区，然后用

du

登录后复制

来找出“罪魁祸首”：

du -sh *

登录后复制

这条命令会列出当前目录下所有文件和子目录的总大小，同样

-h

登录后复制

是为了可读性，

-s

登录后复制

是只显示总计，不显示每个文件的详细信息。如果发现某个子目录特别大，我就会

cd

登录后复制

进去，继续用

du -sh *

登录后复制

，一层一层地“钻”下去，直到找到那个占用空间巨大的文件或目录。

有时候，你可能想知道某个目录下，哪些子目录是最大的，但又不想深入太多层。那么，

--max-depth

登录后复制

参数就很有用了：

du -h --max-depth=1 /path/to/directory

登录后复制

这会显示指定路径下第一层子目录的大小。

当然，如果你的系统里有很多文件和目录，

du

登录后复制

的输出可能会非常长，找起来也费劲。这时候，我个人非常推荐一个交互式的工具——

ncdu

登录后复制

（NCurses Disk Usage）。它基本上就是

du

登录后复制

的增强版，提供了一个类似文件管理器的界面，你可以用方向键在目录间穿梭，非常直观地看到每个目录的大小，并且能快速排序。安装它也很简单，比如在Debian/Ubuntu上：

sudo apt install ncdu

登录后复制

然后直接运行

ncdu

登录后复制

就可以扫描当前目录，或者

ncdu /path/to/scan

登录后复制

扫描指定路径。这玩意儿用起来效率极高，尤其是在处理那些结构复杂、文件众多的目录时，简直是神器。

为什么定期检查磁盘空间如此重要？它能避免哪些潜在问题？

定期检查磁盘空间，这事儿听起来可能有点“老生常谈”，但它绝对是系统维护里最容易被忽视，却又最能引发“血案”的环节之一。我个人就吃过不少这方面的亏。

最直接的，也是最常见的，就是系统不稳定甚至崩溃。你想想，如果你的根分区（

登录后复制

）或者

/var

登录后复制

分区（通常存放日志、缓存、数据库等）满了，操作系统就没法写入新的日志，没法创建临时文件，甚至连正常的系统更新都可能失败。我以前就遇到过因为

/var

登录后复制

分区爆满，导致Nginx无法写入access log，进而整个Web服务都挂掉的情况。那种手忙脚乱的感觉，真是记忆犹新。

接着，是应用程序的异常行为和性能下降。很多应用程序在运行过程中会产生临时文件、缓存文件，或者需要写入数据。磁盘空间不足，这些操作就可能失败，导致应用报错、功能异常，甚至直接崩溃。数据库尤其敏感，空间不足可能导致事务无法提交，数据损坏，那可就麻烦大了。

再者，安全更新和软件包安装会受阻。Linux系统需要定期更新以修补漏洞、提升性能。如果磁盘空间不足，

apt

登录后复制

、

yum

登录后复制

或

dnf

登录后复制

这些包管理器就无法下载和安装新的软件包，你的系统就可能暴露在安全风险之下。

还有，日志文件失控。这是我个人最常遇到的问题。某些应用或服务，在调试模式下或者出现大量错误时，日志文件会以惊人的速度增长，几天之内就能把整个分区塞满。如果不及时发现并处理，后果不堪设想。

黑点工具

在线工具导航网站，免费使用无需注册，快速使用无门槛。

查看详情

说到底，定期检查磁盘空间，就像是给你的系统做健康体检。它能让你提前发现潜在的“病灶”，而不是等到“病入膏肓”才去抢救。这不仅仅是技术问题，更是一种良好的运维习惯，能帮你省去无数的麻烦和加班时间。

除了基本的命令，还有哪些高级技巧或第三方工具可以更有效地管理磁盘？

除了

df

登录后复制

、

du

登录后复制

和

ncdu

登录后复制

这些基础而强大的工具，在实际运维中，我们确实需要一些更高级的技巧和工具来更精细、更自动化地管理磁盘空间。毕竟，总不能每天手动去跑命令吧？

一个我经常用到的场景是，当发现某个目录异常庞大时，我需要找出是哪些文件在作怪，特别是那些又大又旧、可能已经被遗忘的文件。这时，

find

登录后复制

命令就派上大用场了。你可以用它来查找特定大小、特定时间范围的文件：

# 查找根目录下所有大于1GB的文件，并显示其大小
find / -type f -size +1G -print0 | xargs -0 du -h

登录后复制

这里的

-print0

登录后复制

和

xargs -0

登录后复制

组合，是为了处理文件名中可能包含空格或特殊字符的情况，是个好习惯。你也可以加上

-mtime +365

登录后复制

来查找一年以前修改的文件，这样就能清理那些“老古董”了。

对于日志文件，手动清理显然不是长久之计。Linux系统自带了一个非常强大的日志管理工具——

logrotate

登录后复制

。它能自动帮你压缩、归档、删除旧的日志文件。我通常会检查

/etc/logrotate.conf

登录后复制

和

/etc/logrotate.d/

登录后复制

目录下的配置文件，确保所有重要的服务日志都得到了妥善的轮转配置。如果某个服务的日志没有被

logrotate

登录后复制

管理，我会手动添加一个配置文件，这能极大减轻日志爆满的风险。

在更复杂的环境中，我们可能需要对用户或组进行磁盘配额管理。

quota

登录后复制

工具就是为此而生。通过设置软限制和硬限制，你可以限制某个用户或组可以使用的磁盘空间，这对于多用户共享的服务器环境非常有用，能有效防止某个用户无限制地占用资源。

# 查看某个文件系统的配额使用情况
quota -s /path/to/filesystem

登录后复制

对于企业级的监控，仅仅依靠命令行工具是不够的。这时候，专业的监控系统就显得尤为重要。像Prometheus结合Node Exporter，或者Zabbix、Nagios等，它们可以实时收集各个服务器的磁盘使用率数据，并提供图表展示、历史趋势分析，最重要的是，可以配置复杂的告警规则。例如，当某个分区的磁盘使用率达到80%时发出警告，达到95%时发出严重警告，甚至自动触发一些清理脚本。这些工具能够将磁盘监控从被动的手动检查，升级为主动的自动化预警和管理。

如何设置磁盘空间预警机制，避免突发性空间耗尽？

避免突发性空间耗尽，最核心的策略就是建立一套有效的预警机制。仅仅是手动检查，总是会有疏漏的时候，尤其是在管理多台服务器时。自动化预警才是王道，它能让你在问题变得严重之前就收到通知，从而有时间去处理。

最简单、最直接的预警方式，就是编写一个简单的Shell脚本，然后通过

cron

登录后复制

定时执行。这个脚本可以定期检查磁盘使用率，一旦达到某个阈值，就通过邮件或其他方式通知你。

这是一个我经常使用的简化版脚本示例：

#!/bin/bash

# 设定磁盘使用率的阈值（百分比）
THRESHOLD=85

# 设定接收警告的邮箱地址
EMAIL="your_email@example.com"

# 获取所有文件系统的使用情况，过滤掉非本地文件系统和snap/loop等
# 然后只保留使用率和挂载点
df -hP | awk 'NR>1 {print $5, $6}' | while read USE_PERCENT MOUNT_POINT; do
    # 移除百分号，转换为整数
    PERCENT=$(echo $USE_PERCENT | sed 's/%//g')

    # 检查是否超过阈值
    if (( PERCENT > THRESHOLD )); then
        ALERT_MESSAGE="警告：${MOUNT_POINT} 磁盘使用率已达 ${USE_PERCENT}，超过 ${THRESHOLD}%！"
        echo "$ALERT_MESSAGE" | mail -s "Linux服务器磁盘空间警告" "$EMAIL"
        # 也可以在这里添加其他通知方式，比如发送到Slack或Teams
    fi
done

登录后复制

这个脚本的工作原理很简单：它用

df -hP

登录后复制

获取所有文件系统的使用情况（

-P

登录后复制

是为了确保输出格式一致，方便

awk

登录后复制

处理），然后解析出使用百分比和挂载点。接着，它会循环检查每个文件系统，如果使用率超过了你设定的

THRESHOLD

登录后复制

，就会通过

mail

登录后复制

命令发送一封邮件给你。

要让这个脚本自动运行，你需要把它保存到一个文件（比如

check_disk_space.sh

登录后复制

），给它执行权限（

chmod +x check_disk_space.sh

登录后复制

），然后添加到

cron

登录后复制

任务中。例如，如果你想让它每小时执行一次，可以这样添加到

crontab

登录后复制

：

# 编辑cron任务
crontab -e

# 添加以下行，表示每小时的第0分钟执行
0 * * * * /path/to/your/script/check_disk_space.sh

登录后复制

当然，更健壮的解决方案会依赖于专业的监控系统，比如前面提到的Prometheus、Zabbix或Nagios。这些系统提供了更丰富的告警规则配置（例如，可以设置不同的告警级别、告警升级策略），更灵活的通知渠道（邮件、短信、Webhook到即时通讯工具），以及历史数据的可视化。

在这些监控系统中，你可以定义这样的规则：

警告（Warning）级别： 当磁盘使用率达到80%时触发。这通常意味着你需要开始关注并计划清理。
严重（Critical）级别： 当磁盘使用率达到95%时触发。这表示情况紧急，需要立即采取行动，否则系统服务随时可能中断。

通过这些分级的预警，你就能在磁盘空间问题演变成灾难之前，获得足够的反应时间，从而避免那些令人头疼的突发性空间耗尽问题。这不仅仅是技术上的配置，更是一种风险管理和预防的思维模式。

以上就是如何在Linux系统中监控磁盘空间使用情况？实用工具和命令的详细解析的详细内容，更多请关注php中文网其它相关文章！

大家都在看：

LINUX系统如何更新内核_Linux内核升级与管理方法 LINUX系统出现"Read-only file system"错误怎么办_Linux只读文件系统错误排查方法 LINUX怎么使用rsync通过SSH同步文件_Linux使用Rsync通过SSH同步方法 LINUX怎么写一个简单的shell脚本_Linux简单Shell脚本编写方法 LINUX如何设置PATH环境变量使其永久生效_Linux环境变量配置技巧