温馨提示×

怎样清理centos的重复文件

小樊
32
2025-03-01 14:18:15
栏目: 智能运维
Centos服务器限时活动,0元免费领,库存有限,领完即止! 点击查看>>

在CentOS系统中清理重复文件可以通过多种方法实现,以下提供两种常用的方法:

方法一:使用fdupes工具

  1. 安装fdupes

    sudo yum install fdupes
    
  2. 查找重复文件: 使用fdupes命令查找指定目录下的重复文件。例如,查找/home/user/documents目录下的重复文件:

    fdupes -r /home/user/documents
    

    -r选项表示递归查找子目录中的文件。

  3. 删除重复文件: 如果你确定要删除重复文件,可以使用-N选项来交互式地选择保留哪个文件并删除其他重复项:

    fdupes -r -N /home/user/documents
    

    或者直接删除所有重复文件(谨慎操作):

    fdupes -r -d /home/user/documents
    

    -d选项表示删除重复文件,只保留一个副本。

方法二:使用findmd5sum脚本

  1. 创建一个临时目录

    mkdir ~/temp_duplicates
    
  2. 编写脚本查找并移动重复文件: 创建一个名为find_duplicates.sh的脚本,并添加以下内容:

    #!/bin/bash
    
    # 指定要检查的目录
    CHECK_DIR="/path/to/your/directory"
    
    # 查找所有文件的MD5值并存储到临时文件中
    find "$CHECK_DIR" -type f -print0 | sort -z | xargs -0 md5sum > /tmp/md5sums.txt
    
    # 查找重复的MD5值
    awk '{print $1}' /tmp/md5sums.txt | sort | uniq -d | while read -r md5; do
        # 找到所有具有相同MD5值的文件路径
        files=$(grep "^$md5" /tmp/md5sums.txt | cut -d' ' -f2-)
        # 移动重复文件到临时目录
        for file in $files; do
            mv "$file" ~/temp_duplicates/
        done
    done
    
    # 删除临时文件
    rm /tmp/md5sums.txt
    rm -r ~/temp_duplicates
    
  3. 赋予脚本执行权限并运行

    chmod +x find_duplicates.sh
    ./find_duplicates.sh
    

注意事项

  • 在删除重复文件之前,请务必备份重要数据。
  • 使用fdupes-N选项时,系统会提示你选择保留哪个文件,确保你了解每个操作。
  • 使用findmd5sum脚本时,脚本会将所有重复文件移动到一个临时目录中,你可以手动检查这些文件后再决定是否删除。

通过以上方法,你可以有效地清理CentOS系统中的重复文件。

亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>

推荐阅读:如何清理centos中的重复文件

0