在CentOS系统中清理重复文件可以通过多种方法实现,以下提供两种常用的方法:
fdupes
工具安装fdupes
:
sudo yum install fdupes
查找重复文件:
使用fdupes
命令查找指定目录下的重复文件。例如,查找/home/user/documents
目录下的重复文件:
fdupes -r /home/user/documents
-r
选项表示递归查找子目录中的文件。
删除重复文件:
如果你确定要删除重复文件,可以使用-N
选项来交互式地选择保留哪个文件并删除其他重复项:
fdupes -r -N /home/user/documents
或者直接删除所有重复文件(谨慎操作):
fdupes -r -d /home/user/documents
-d
选项表示删除重复文件,只保留一个副本。
find
和md5sum
脚本创建一个临时目录:
mkdir ~/temp_duplicates
编写脚本查找并移动重复文件:
创建一个名为find_duplicates.sh
的脚本,并添加以下内容:
#!/bin/bash
# 指定要检查的目录
CHECK_DIR="/path/to/your/directory"
# 查找所有文件的MD5值并存储到临时文件中
find "$CHECK_DIR" -type f -print0 | sort -z | xargs -0 md5sum > /tmp/md5sums.txt
# 查找重复的MD5值
awk '{print $1}' /tmp/md5sums.txt | sort | uniq -d | while read -r md5; do
# 找到所有具有相同MD5值的文件路径
files=$(grep "^$md5" /tmp/md5sums.txt | cut -d' ' -f2-)
# 移动重复文件到临时目录
for file in $files; do
mv "$file" ~/temp_duplicates/
done
done
# 删除临时文件
rm /tmp/md5sums.txt
rm -r ~/temp_duplicates
赋予脚本执行权限并运行:
chmod +x find_duplicates.sh
./find_duplicates.sh
fdupes
的-N
选项时,系统会提示你选择保留哪个文件,确保你了解每个操作。find
和md5sum
脚本时,脚本会将所有重复文件移动到一个临时目录中,你可以手动检查这些文件后再决定是否删除。通过以上方法,你可以有效地清理CentOS系统中的重复文件。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
推荐阅读:如何清理centos中的重复文件