同じ行が何度も出てくるテキストをスッキリ整理する方法

テキストファイルを扱っていると、同じ行が何度も繰り返し出てきて「見づらい」「扱いにくい」と感じることはありませんか。

たとえば、次のようなケースです。

ログファイルに同じエラーメッセージが何度も出力されている
CSVやリストの中で同じデータが繰り返し含まれている
メモやコピーを重ねて作ったテキストに重複が多い

こうした「不要な重複行」をそのまま残しておくと、後からの確認や分析がやりにくくなり、作業効率が落ちてしまいます。
この記事では、テキストをスッキリ整理するために、重複行を削除する方法を紹介します。

重複行を削除するメリット
重複行を整理する基本的な考え方
実例：重複行を削除する方法
標準検索や手作業では限界がある
まとめ
関連記事

重複行を削除するメリット

テキストから重複を取り除くことで、次のようなメリットがあります。

見やすさの向上：同じ行がなくなり、情報を把握しやすくなる
データ分析が正確になる：ユニークな値だけが残るため、重複カウントを避けられる
処理の効率化：無駄なデータが減ることで検索や集計が速くなる
エラー調査が楽になる：同じエラーログが連続して出ても、種類ごとに確認できる

特に、大量のログやCSVファイルを扱う場合は、重複削除の効果が大きく現れます。

重複行を整理する基本的な考え方

テキスト内の重複を取り除くには、次の2ステップで考えると分かりやすいです。

並べ替え（sort）
→ 同じ内容の行を隣り合わせにする
重複の削除（uniq）
→ 隣り合った同じ行を1つにまとめる

この仕組みを使えば、何百行・何千行のテキストからでも、簡単にユニークなデータだけを残せます。

実例：重複行を削除する方法

基本の重複削除

sort data.txt | uniq > cleaned.txt

sortでテキストを並べ替え
uniqで重複を削除
結果を cleaned.txt に保存

これで、重複行を取り除いたテキストが完成します。

出現回数も確認する

sort data.txt | uniq -c

各行が何回出現したかを数字付きで表示します。
「どの行がよく現れるのか」を把握したいときに便利です。

完全一致でなく「連続する重複」を削除する

uniq logfile.txt

ファイルを並べ替えずに実行すると、連続して現れる同じ行だけをまとめます。
ログ確認など「同じメッセージが連続している場合だけ整理したい」ときに有効です。

標準検索や手作業では限界がある

もちろん、エディタで「検索して削除」も可能ですが、以下の問題があります。

ファイルが大きいと処理が重い
重複が数百・数千行に及ぶと、手作業では現実的でない
出現回数を数えるのが難しい

このため、シンプルなコマンドで重複削除を行う方が効率的です。

まとめ

同じ行が繰り返し現れるテキストは、そのままでは扱いづらく、分析や整理の妨げになります。

sortで並べ替え
uniqで重複削除
必要に応じて「出現回数表示」で分析

この流れを覚えておけば、大量のログやCSVでもスッキリ整理できるようになります。
重複が多くて困っている人は、ぜひ取り入れてみてください。

重複ファイルを無料で削除する方法｜効率的に容量を整理するコツパソコンを使っていると、同じファイルを何度もコピーしてしまったり、写真や音楽が重複して保存されてしまうことがあります。気づかないうちに重複ファイルが増えていくと、ディスク容量を圧迫し「容量不足」に悩まされる原因になります […]...
2000行Markdownを一気に表示：ターミナルでサクサク読む・探す・書く 2000行を超えるような巨大Markdownファイルを扱うと、VSCodeの標準プレビューや「Markdown Preview Enhanced」といった拡張機能では途中で表示が止まったり、スクロールが極端に重くなること […]...
容量不足を防ぐ！df・duコマンドでディスク使用量をチェックする基本サーバーを運用していると、ある日突然「ディスク容量が不足しています」というエラーに直面することがあります。容量が逼迫するとログが書き込めず、アプリケーションが停止したり、バックアップが失敗したりといった深刻な障害につなが […]...
Linux初心者がまず覚える監視コマンド｜CPUやメモリの使いすぎを調べるtop入門サーバーやパソコンを使っていると、「なんだか動作が重い」「アプリがすぐに固まる」と感じることはありませんか。とくにクラウドやVPSを契約してLinuxを触り始めたばかりの方にとっては、原因が分からないまま不安になることも […]...
第5章: 業務を効率化するBashスクリプト本連載は、Bashによる業務効率化の連載の一つです。Bashスクリプトを活用することで、日々の繰り返し業務を自動化し、業務負担を軽減する方法を紹介します。本記事を読むことで、以下のことが学べます。この知識を身につける […]...
大きいファイルを安全に分割保存｜split -b/-n と catで結合する手順「外付けHDDが FAT32で4GB制限」「クラウドへ段階的にアップしたい」「メールで小分け配布したい」——そんなときに便利なのが split での分割保存です。ここではコピペで動く最短レシピ → 用途別の分割術 → […]...
普通の検索じゃ足りないときに｜条件付きで文字を探すテクニックパソコンに標準で備わっている検索機能は便利ですが、実際の作業では「もっと細かく条件を付けて探したい」と思う場面が少なくありません。たとえば次のようなケースです。こうしたニーズは、WindowsやMacに標準で搭載され […]...
動かなくなったアプリや処理を止める方法｜Linuxでの強制終了コマンド入門パソコンを操作していてアプリが急にフリーズし、どんなにクリックしても反応しない…。あるいは、サーバーで動かしている処理が止まらず、負荷が高いまま改善しない…。こうした「終了したいのに止められない」という状況は、Linux […]...