首页 > 系统教程 > LINUX > 正文

如何在Linux中比较文件差异?使用diff命令分析两个文件的不同

蓮花仙者
发布: 2025-08-28 09:14:01
原创
653人浏览过
答案:diff命令通过输出行号和操作符显示文件差异,使用-u选项可生成更易读的统一格式,-y选项实现并排对比,-r参数支持目录递归比较,而二进制文件应使用cmp命令处理。

如何在linux中比较文件差异?使用diff命令分析两个文件的不同

在Linux中比较文件差异,

diff
登录后复制
命令是你的核心工具。它能精准地指出两个文本文件之间,或者两个目录中同名文件之间的具体不同之处,是版本控制、代码审查和配置管理不可或缺的利器。

要比较两个文件的差异,最基础的用法就是

diff 文件1 文件2
登录后复制
。这命令一敲下去,它就会把两个文件哪里不一样,用一种它自己的语言告诉你。

比如,我有两个文件,

file1.txt
登录后复制
file2.txt
登录后复制

file1.txt
登录后复制
:

Hello world.
This is line two.
A third line here.
登录后复制

file2.txt
登录后复制
:

Hello Linux.
This is line two.
A different third line.
Fourth line added.
登录后复制

我执行

diff file1.txt file2.txt
登录后复制
,输出会是这样:

1c1
< Hello world.
---
> Hello Linux.
3c3,4
< A third line here.
---
> A different third line.
> Fourth line added.
登录后复制

这输出一开始看可能有点蒙,但其实逻辑很简单:

  • 1c1
    登录后复制
    表示
    file1.txt
    登录后复制
    的第1行和
    file2.txt
    登录后复制
    的第1行有“更改”(change)。
  • <
    登录后复制
    后面跟着的是
    file1.txt
    登录后复制
    中被修改或删除的内容。
  • >
    登录后复制
    后面跟着的是
    file2.txt
    登录后复制
    中新增或修改后的内容。
  • ---
    登录后复制
    是一个分隔符。
  • 3c3,4
    登录后复制
    表示
    file1.txt
    登录后复制
    的第3行和
    file2.txt
    登录后复制
    的第3到第4行有更改。

这个默认输出格式叫

ed
登录后复制
格式,对机器处理很友好,但人读起来嘛,就有点考验耐心了。

如何更直观地解读diff命令的输出结果?

说实话,

diff
登录后复制
的默认输出,也就是
ed
登录后复制
格式,对于我们人类肉眼来说,确实不够友好。每次看到那堆
c
登录后复制
a
登录后复制
d
登录后复制
,总得在脑子里转个弯。所以,我个人在日常使用中,几乎从不直接用默认格式,而是更偏爱那些能把差异展现得更清晰的选项。

最常用的,也是我强烈推荐的,是统一(Unified)格式,通过

-u
登录后复制
选项来启用。它会把上下文也显示出来,让你清楚地知道差异发生在哪里。

diff -u file1.txt file2.txt
登录后复制

输出会变成这样:

--- file1.txt   2023-10-27 10:00:00.000000000 +0800
+++ file2.txt   2023-10-27 10:01:00.000000000 +0800
@@ -1,3 +1,4 @@
-Hello world.
+Hello Linux.
 This is line two.
-A third line here.
+A different third line.
+Fourth line added.
登录后复制

看,这一下子就清晰多了!

  • ---
    登录后复制
    +++
    登录后复制
    分别指示了原始文件和新文件。
  • @@ -1,3 +1,4 @@
    登录后复制
    这是一个“块头”,告诉你这个差异块在
    file1.txt
    登录后复制
    中是从第1行开始的3行,在
    file2.txt
    登录后复制
    中是从第1行开始的4行。
  • -
    登录后复制
    开头的行表示只存在于
    file1.txt
    登录后复制
    file2.txt
    登录后复制
    中没有的行(被删除或修改前的)。
  • +
    登录后复制
    开头的行表示只存在于
    file2.txt
    登录后复制
    file1.txt
    登录后复制
    中没有的行(被添加或修改后的)。
  • 没有前缀的行是两个文件都相同,作为上下文出现的行。

除了

-u
登录后复制
,还有一个非常直观的选项是
-y
登录后复制
,它会以并排(Side-by-side)的方式显示两个文件。如果你终端够宽,或者想一眼看到两个文件的全貌,这个就很方便。通常还会结合
-W
登录后复制
来指定宽度。

diff -y -W 80 file1.txt file2.txt
登录后复制

这会把两个文件内容并排显示,中间用符号标记差异。

百度智能云·曦灵
百度智能云·曦灵

百度旗下的AI数字人平台

百度智能云·曦灵 83
查看详情 百度智能云·曦灵
Hello world.                                | Hello Linux.
This is line two.                             This is line two.
A third line here.                          | A different third line.
                                            > Fourth line added.
登录后复制

这简直是为人类阅读量身定制的!左边是旧文件,右边是新文件。

|
登录后复制
表示行有修改,
<
登录后复制
表示左边独有,
>
登录后复制
表示右边独有。当然,如果文件内容很长,或者差异很细微,我可能还是会倾向于
diff -u
登录后复制
,因为并排模式在处理大文件时,可能会让屏幕滚动得有点快,而且上下文的连贯性不如统一格式那么紧凑。所以,选择哪个模式,真的要看你具体想看什么,以及你的屏幕有多大。

如何利用diff命令比较目录和处理特殊文件类型?

diff
登录后复制
命令的强大之处,可不仅仅局限于比较两个单独的文本文件。在日常工作中,我们经常需要对比两个目录,看看哪些文件被修改了,哪些是新增的,哪些又被删除了。这时候,
diff -r
登录后复制
(recursive,递归)就派上用场了。

想象一下,你有一个项目目录

project_v1
登录后复制
和它的新版本
project_v2
登录后复制
。你想知道这两个版本之间到底改了什么。

diff -r project_v1 project_v2
登录后复制

这个命令会递归地遍历两个目录,找出所有不同之处。它会报告:

  • 只存在于一个目录而另一个目录中没有的文件或子目录。
  • 两个目录中同名但内容不同的文件,并用标准的
    diff
    登录后复制
    格式(通常是
    ed
    登录后复制
    格式,但你也可以加上
    -u
    登录后复制
    -y
    登录后复制
    )显示文件内部的差异。

例如,如果

project_v1/src/main.c
登录后复制
project_v2/src/main.c
登录后复制
内容不同,它就会像比较普通文件一样显示它们的差异。如果
project_v2
登录后复制
多了一个
README.md
登录后复制
,它会显示
Only in project_v2: README.md
登录后复制
。这对于快速概览两个代码库或配置集的变动情况非常有用。

然而,当涉及到二进制文件时,

diff
登录后复制
命令就有点力不从心了。
diff
登录后复制
主要是为文本文件设计的,它尝试比较二进制文件时,通常只会告诉你
Binary files X and Y differ
登录后复制
,或者干脆输出一堆乱码,因为二进制数据没有“行”的概念,也不是可读的字符。这种时候,我们通常会转向另一个专门的工具:
cmp
登录后复制

cmp
登录后复制
命令是“compare”的缩写,它专门用于比较两个文件的字节内容。它的输出非常简洁:如果文件相同,它什么都不输出;如果不同,它会告诉你第一个不同之处发生在哪个字节和哪一行(如果它能识别行的话)。

cmp file1.bin file2.bin
登录后复制

如果

file1.bin
登录后复制
file2.bin
登录后复制
不同,你可能会看到类似这样的输出:
file1.bin file2.bin differ: byte 10, line 2
登录后复制

所以,我的经验是,对于目录和文本文件,

diff -r
登录后复制
是主力;但一旦涉及图片、编译后的程序、压缩包等二进制文件,就果断切换到
cmp
登录后复制
。这样分工明确,效率更高,也避免了
diff
登录后复制
在二进制文件上给出的误导性或无用信息。

提升效率:diff命令的高级应用与实践技巧

diff
登录后复制
命令的基础用法固然重要,但在日常的开发、运维工作中,我们往往需要更深入、更灵活地使用它。我发现,真正能把
diff
登录后复制
用得出神入化的人,都是那些懂得将它融入自动化流程和与其他工具结合的人。

一个非常实用的场景是生成补丁(patch)文件。当你修改了一个文件,想要把这些修改分享给别人,但又不想把整个文件发过去时,就可以用

diff -u
登录后复制
生成一个补丁文件。

diff -u old_file.txt new_file.txt > my_changes.patch
登录后复制

这个

my_changes.patch
登录后复制
文件就包含了从
old_file.txt
登录后复制
new_file.txt
登录后复制
的所有变动。接收方拿到这个补丁文件后,可以用
patch
登录后复制
命令轻松地将这些修改应用到他们的
old_file.txt
登录后复制
上:

patch < my_changes.patch
登录后复制

这在开源项目协作、分发小范围更新时特别方便,也比直接发送修改后的文件要高效得多,毕竟补丁文件通常小得多。

另外,

diff
登录后复制
退出状态码在脚本中非常有用。

  • 如果文件完全相同,
    diff
    登录后复制
    会以
    0
    登录后复制
    退出。
  • 如果文件有差异,它会以
    1
    登录后复制
    退出。
  • 如果发生

以上就是如何在Linux中比较文件差异?使用diff命令分析两个文件的不同的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号