パソコンを使っていると、同じファイルを何度もコピーしてしまったり、写真や音楽が重複して保存されてしまうことがあります。気づかないうちに重複ファイルが増えていくと、ディスク容量を圧迫し「容量不足」に悩まされる原因になります。
有料ソフトや専用ツールを使わなくても、実はターミナルやコマンドを使えば 無料で重複ファイルを探して削除 することが可能です。ここではその手順と考え方を紹介します。
重複ファイルを見つける仕組み
重複しているかどうかを見分けるには、ファイル名ではなく 中身(データ内容) を比較するのが確実です。
そのときに役立つのが md5sum というコマンドです。ファイルごとに「ハッシュ値」と呼ばれる一意の値を計算し、同じ内容なら同じ値が出力されます。
この仕組みを利用することで、ファイル名が違っていても中身が同じものを見つけることができます。
重複ファイルを一覧表示する
以下のコマンドを実行すると、フォルダ内のファイルをすべて調べて重複を確認できます。
find . -type f -exec md5sum {} + | sort | uniq -d -w32
find . -type f: カレントフォルダ以下のファイルを検索md5sum: ファイルごとのハッシュ値を計算sort: ハッシュ値で並べ替えuniq -d -w32: 重複している行だけ表示
これで「どのファイルが重複しているか」を確認できます。
重複ファイルを削除する
実際に削除する前に、まずは対象をリストアップすることが大切です。安全に進めるには awk を使って重複のうち一方を残し、不要分だけ削除する方法があります。
find . -type f -exec md5sum {} + | sort | uniq -D -w32 | awk 'NR%2==1 {print $2}' | xargs rm
このコマンドは、重複ファイルのうち一つを残し、残りを削除する仕組みです。
ただし、誤って必要なファイルを消してしまうリスクもあるため、最初は rm を使わずに一覧を確認することをおすすめします。
find . -type f -exec md5sum {} + | sort | uniq -D -w32
これで重複ファイルの候補をチェックしたうえで、削除するかどうかを判断できます。
実用シーン
- 写真や音楽ファイルを長年ため込んで、同じものが複数保存されている
- プロジェクト内にバックアップを作りすぎて容量を圧迫している
- サーバーのログや一時ファイルが重複している
こうしたケースでは、重複を整理するだけで数GB以上の空き容量を取り戻せることもあります。
注意点
- コマンドで削除したファイルはゴミ箱に行かず完全削除されるため、必ず事前にバックアップを取るか、一覧を確認してから削除するようにしてください。
- 大量のファイルを処理すると時間がかかる場合があります。
まとめ
重複ファイルは気づかないうちに増え、容量不足の原因になります。
md5sumで中身を比較すれば、名前が違うファイルでも重複を検出可能uniqと組み合わせることで、効率的に重複ファイルを整理できる- 無料で導入できる方法なので、専用ソフトを使わなくても実現可能
容量不足を解消したい方は、ぜひこの方法を試してみてください。

コメント