重複ファイルを無料で削除する方法|効率的に容量を整理するコツ

ディスク/ストレージ整理

パソコンを使っていると、同じファイルを何度もコピーしてしまったり、写真や音楽が重複して保存されてしまうことがあります。気づかないうちに重複ファイルが増えていくと、ディスク容量を圧迫し「容量不足」に悩まされる原因になります。

有料ソフトや専用ツールを使わなくても、実はターミナルやコマンドを使えば 無料で重複ファイルを探して削除 することが可能です。ここではその手順と考え方を紹介します。

重複ファイルを見つける仕組み

重複しているかどうかを見分けるには、ファイル名ではなく 中身(データ内容) を比較するのが確実です。
そのときに役立つのが md5sum というコマンドです。ファイルごとに「ハッシュ値」と呼ばれる一意の値を計算し、同じ内容なら同じ値が出力されます。

この仕組みを利用することで、ファイル名が違っていても中身が同じものを見つけることができます。

重複ファイルを一覧表示する

以下のコマンドを実行すると、フォルダ内のファイルをすべて調べて重複を確認できます。

find . -type f -exec md5sum {} + | sort | uniq -d -w32
  • find . -type f : カレントフォルダ以下のファイルを検索
  • md5sum : ファイルごとのハッシュ値を計算
  • sort : ハッシュ値で並べ替え
  • uniq -d -w32 : 重複している行だけ表示

これで「どのファイルが重複しているか」を確認できます。

重複ファイルを削除する

実際に削除する前に、まずは対象をリストアップすることが大切です。安全に進めるには awk を使って重複のうち一方を残し、不要分だけ削除する方法があります。

find . -type f -exec md5sum {} + | sort | uniq -D -w32 | awk 'NR%2==1 {print $2}' | xargs rm

このコマンドは、重複ファイルのうち一つを残し、残りを削除する仕組みです。
ただし、誤って必要なファイルを消してしまうリスクもあるため、最初は rm を使わずに一覧を確認することをおすすめします。

find . -type f -exec md5sum {} + | sort | uniq -D -w32

これで重複ファイルの候補をチェックしたうえで、削除するかどうかを判断できます。

実用シーン

  • 写真や音楽ファイルを長年ため込んで、同じものが複数保存されている
  • プロジェクト内にバックアップを作りすぎて容量を圧迫している
  • サーバーのログや一時ファイルが重複している

こうしたケースでは、重複を整理するだけで数GB以上の空き容量を取り戻せることもあります。

注意点

  • コマンドで削除したファイルはゴミ箱に行かず完全削除されるため、必ず事前にバックアップを取るか、一覧を確認してから削除するようにしてください。
  • 大量のファイルを処理すると時間がかかる場合があります。

まとめ

重複ファイルは気づかないうちに増え、容量不足の原因になります。

  • md5sum で中身を比較すれば、名前が違うファイルでも重複を検出可能
  • uniq と組み合わせることで、効率的に重複ファイルを整理できる
  • 無料で導入できる方法なので、専用ソフトを使わなくても実現可能

容量不足を解消したい方は、ぜひこの方法を試してみてください。

Bash玄

はじめまして!Bash玄です。

エンジニアとしてシステム運用に携わる中で、手作業の多さに限界を感じ、Bashスクリプトを活用して業務を効率化したのがきっかけで、この道に入りました。「手作業は負け」「スクリプトはシンプルに」をモットーに、誰でも実践できるBashスクリプトの書き方を発信しています。

このサイトでは、Bashの基礎から実践的なスクリプト作成まで、初心者でもわかりやすく解説しています。少しでも「Bashって便利だな」と思ってもらえたら嬉しいです!

# 好きなこと
- シンプルなコードを書くこと
- コマンドラインを快適にカスタマイズすること
- 自動化で時間を生み出すこと

# このサイトを読んでほしい人
- Bashに興味があるけど、何から始めればいいかわからない人
- 定型業務を自動化したい人
- 効率よくターミナルを使いこなしたい人

Bashの世界に一歩踏み出して、一緒に「Bash道」を極めていきましょう!

Bash玄をフォローする

コメント