百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

Linux查看文件大小:`ls`和`du`为何结果不同?一文讲透原理!

yuyutoo 2025-06-28 17:45 11 浏览 0 评论

Linux查看文件大小:ls和du为何结果不同?一文讲透原理!

在Linux运维中,查看文件大小是日常高频操作。但你是否遇到过以下困惑?


ls看到文件是1GB,用du却显示只有20MB?为什么会有这种差异?本文从底层原理到实战场景,带你彻底理解两者的区别!


一、核心差异:逻辑大小 vs 物理占用

1. ls显示逻辑大小
ls -l展示的是文件内容的实际字节数,即文件创建时写入的数据总量。例如:

$ ls -lh large_file.txt
-rw-r--r-- 1 user 1.2G Apr 8 10:00 large_file.txt

这里的1.2G表示文件内容总大小,无论是否包含空洞或零数据。


2. du显示物理占用
du -h统计的是文件在磁盘上实际占用的空间,受文件系统块大小影响。例如:

$ du -h large_file.txt
20M    large_file.txt

即使文件只有1字节,也会占用至少1个块(默认4KB)的空间。


二、三大关键原因解析

1. 文件系统块机制
o
块大小决定最小单位:Linux文件系统以块(通常4KB)为单位分配空间。
o
计算公式磁盘占用 = ceil(文件大小 / 块大小) × 块大小
例如:13KB文件占用4个块 → 16KB空间。


2. 稀疏文件(Sparse File)
稀疏文件通过"空洞"技术节省空间,表现为:
o
ls显示逻辑总大小
o du仅统计实际写入的数据块

# 创建1GB稀疏文件(实际占用200MB)
dd if=/dev/zero of=sparse.img bs=1M seek=1024 count=0
ls -lh sparse.img  # 显示1.0G
du -h sparse.img   # 显示200M

3. 目录统计规则
o
ls仅显示目录元数据大小(通常4KB)
o du递归统计目录内所有文件大小

$ mkdir test_dir
$ touch test_dir/file{1..100}  # 创建100个空文件
$ ls -ld test_dir            # 显示4.0K
$ du -sh test_dir            # 显示约400K(100个文件×4KB块)

三、实战场景分析

场景1:日志文件异常增长

# 发现日志文件显示10GB,但磁盘空间只占用2GB
ls -lh app.log      # 10G
du -h app.log       # 2G

# 原因:日志文件被清空但进程未释放(需重启服务)
lsof | grep deleted  # 查看被删除但仍被占用的文件

场景2:备份文件体积差异

# 原始文件10GB,压缩后生成backup.tar.gz
ls -lh backup.tar.gz  # 显示9.8G
du -h backup.tar.gz   # 显示2.1G(压缩+块分配)

四、进阶技巧

1. 查看真实磁盘占用

# 统计目录总大小(含子目录)
du -sh /var/log

# 按大小排序(快速定位大文件)
du -ah / | sort -rh | head -n 20

2. 处理稀疏文件

# 复制时保留稀疏特性
cp --sparse=always large.img backup.img

3. 权限问题排查

# 无权限文件导致统计异常
sudo du -sh /protected_dir

五、总结对比表

特性

ls命令

du命令

统计对象

文件逻辑大小

磁盘物理占用空间

单位

字节(可转人类可读格式)

块大小(默认4KB)

目录处理

仅显示目录元数据大小

递归统计所有子文件和目录

稀疏文件

显示总大小

显示实际占用空间


运维小贴士
o 日常监控用
du了解真实存储消耗
o 文件传输时用ls确认内容完整性
o 疑似空间泄漏时结合lsof排查

下次遇到文件大小差异,你一定能快速定位原因!如果觉得有用,欢迎转发给更多运维小伙伴~

相关推荐

当 Linux 根分区 (/) 已满时如何释放空间?

根分区(/)是Linux文件系统的核心,包含操作系统核心文件、配置文件、日志文件、缓存和用户数据等。当根分区满载时,系统可能出现无法写入新文件、应用程序崩溃甚至无法启动的情况。常见原因包括:...

玩转 Linux 之:磁盘分区、挂载知多少?

今天来聊聊linux下磁盘分区、挂载的问题,篇幅所限,不会聊的太底层,纯当科普!!1、Linux分区简介1.1主分区vs扩展分区硬盘分区表中最多能存储四个分区,但我们实际使用时一般只分为两...

Linux 文件搜索神器 find 实战详解,建议收藏

在Linux系统使用中,作为一个管理员,我希望能查找系统中所有的大小超过200M文件,查看近7天系统中哪些文件被修改过,找出所有子目录中的可执行文件,这些任务需求...

Linux 操作系统磁盘操作(linux 磁盘命令)

一、文档介绍本文档描述Linux操作系统下多种场景下的磁盘操作情况。二、名词解释...

Win10新版19603推送:一键清理磁盘空间、首次集成Linux文件管理器

继上周四的Build19592后,微软今晨面向快速通道的Insider会员推送Windows10新预览版,操作系统版本号Build19603。除了一些常规修复,本次更新还带了不少新功能,一起来了...

Android 16允许Linux终端使用手机全部存储空间

IT之家4月20日消息,谷歌Pixel手机正朝着成为强大便携式计算设备的目标迈进。2025年3月的更新中,Linux终端应用的推出为这一转变奠定了重要基础。该应用允许兼容的安卓设备...

Linux 系统管理大容量磁盘(2TB+)操作指南

对于容量超过2TB的磁盘,传统MBR分区表的32位寻址机制存在限制(最大支持2.2TB)。需采用GPT(GUIDPartitionTable)分区方案,其支持64位寻址,理论上限为9.4ZB(9....

Linux 服务器上查看磁盘类型的方法

方法1:使用lsblk命令lsblk输出说明:TYPE列显示设备类型,如disk(物理磁盘)、part(分区)、rom(只读存储)等。...

ESXI7虚机上的Ubuntu Linux 22.04 LVM空间扩容操作记录

本人在实际的使用中经常遇到Vmware上安装的Linux虚机的LVM扩容情况,最终实现lv的扩容,大多数情况因为虚机都是有备用或者可停机的情况,一般情况下通过添加一块物理盘再加入vg,然后扩容lv来实...

5.4K Star很容易!Windows读取Linux磁盘格式工具

[开源日记],分享10k+Star的优质开源项目...

Linux 文件系统监控:用脚本自动化磁盘空间管理

在Linux系统中,文件系统监控是一项非常重要的任务,它可以帮助我们及时发现磁盘空间不足的问题,避免因磁盘满而导致的系统服务不可用。通过编写脚本自动化磁盘空间管理,我们可以更加高效地处理这一问题。下面...

Linux磁盘管理LVM实战(linux实验磁盘管理)

LVM(逻辑卷管理器,LogicalVolumeManager)是一种在Linux系统中用于灵活管理磁盘空间的技术,通过将物理磁盘抽象为逻辑卷,实现动态调整存储容量、跨磁盘扩展等功能。本章节...

Linux查看文件大小:`ls`和`du`为何结果不同?一文讲透原理!

Linux查看文件大小:ls和du为何结果不同?一文讲透原理!在Linux运维中,查看文件大小是日常高频操作。但你是否遇到过以下困惑?...

使用 df 命令检查服务器磁盘满了,但用 du 命令发现实际小于磁盘容量

在Linux系统中,管理员或开发者经常会遇到一个令人困惑的问题:使用...

Linux磁盘爆满紧急救援指南:5步清理释放50GB+小白也能轻松搞定

“服务器卡死?网站崩溃?当Linux系统弹出‘Nospaceleft’的红色警报,别慌!本文手把手教你从‘删库到跑路’进阶为‘磁盘清理大师’,5个关键步骤+30条救命命令,快速释放磁盘空间,拯救你...

取消回复欢迎 发表评论: