練習問題：テキスト整形（sed・awk・sort・uniq）10問

置換・整形・列処理・集計・重複処理など、実務で最も出番が多い領域です。
sed / awk / sort / uniq を組み合わせて、日常的なログやCSV処理の基礎を鍛えます。

想定レベル：Lv2〜4／目安：各5〜8分

1) ファイル内の文字列を一括置換する
2) 先頭に行番号を付けて表示する
3) CSV の 2列目だけを取り出す
4) ログから日付（1列目）を抽出してユニークに並べる
5) ログ内の 404 エラー件数をカウントする
6) ファイルの中から空行を削除する
7) ファイルの中の重複行を削除する（順序は問わない）
8) ソート済みデータから重複行と件数をまとめる
9) エラーログから “ERROR” を含む行だけを抽出し、日時順に並べる
10) CSV の 3列目を合計する
1. 学習のヒント
関連記事

1) ファイル内の文字列を一括置換する

問題：config.txt 内の文字列 http:// をすべて https:// に置換してください（上書き保存）。
ヒント：-i オプションで直接書き換え。

▶解答例

sed -i "s|http://|https://|g" config.txt

2) 先頭に行番号を付けて表示する

問題：data.txt を読み込み、各行の先頭に行番号を付けて表示してください。
ヒント：awk の NR。

▶解答例

awk "{print NR, $0}" data.txt

3) CSV の 2列目だけを取り出す

問題：カンマ区切りの users.csv から 2列目（ユーザー名）だけを取り出して表示してください。
ヒント：-F, で区切り文字指定。

▶解答例

awk -F, "{print $2}" users.csv

4) ログから日付（1列目）を抽出してユニークに並べる

問題：スペース区切りの access.log から 1列目（日付部分） を取り出し、重複を除いて表示してください。
ヒント：sort -u。

▶解答例

awk "{print $1}" access.log | sort -u

5) ログ内の 404 エラー件数をカウントする

問題：access.log に含まれるステータスコード 404 の出現回数を数えてください。
ヒント：フィルタ → 件数。

▶解答例

awk "$9 == 404 {count++} END {print count}" access.log

6) ファイルの中から空行を削除する

問題：notes.txt の空行をすべて削除して出力してください。
ヒント：^$ は空行。

▶解答例

sed "/^$/d" notes.txt

7) ファイルの中の重複行を削除する（順序は問わない）

問題：list.txt の重複行を取り除いて出力してください（順序はソート順でよい）。
ヒント：sort -u。

▶解答例

sort -u list.txt

8) ソート済みデータから重複行と件数をまとめる

問題：words.txt をソートした上で、各単語の出現回数とともに表示してください。
ヒント：uniq -c。

▶解答例

sort words.txt | uniq -c

9) エラーログから “ERROR” を含む行だけを抽出し、日時順に並べる

問題：app.log のうち “ERROR” を含む行を抽出し、1列目の日時で昇順ソートしてください。
ヒント：grep と sort の組み合わせ。

▶解答例

grep "ERROR" app.log | sort -k1,1

10) CSV の 3列目を合計する

問題：カンマ区切り sales.csv の 3列目（売上数値） を合計して表示してください。
ヒント：awk の変数加算。

▶解答例

awk -F, "{sum+=$3} END {print sum}" sales.csv

学習のヒント

sed → 文字列置換・削除に強い
awk → 列操作・集計に強い
sort → 並べ替え・-kでキー指定
uniq → 重複処理（必ずソート後に使うと安定）

このカテゴリは実務で最も使用頻度が高く、ログ解析・CSV処理・テキスト整形の基礎になります。

ログ調査がサクサク進む：grep・awk・sedで原因特定する実務パターン集障害対応の現場で「とりあえず grep」から先に進めず、原因特定が長引いてしまう——そんな経験はありませんか。ログ調査は勘や根性ではなく、時系列→範囲→粒度→要約という思考の順番と、grep・awk・sedで再現できる“ […]...
練習問題：検索・抽出（grep編）基礎10問短時間で「見つける・数える・切り分ける」を鍛える10問です。答えはクリックで展開できます。目次 1) access.log から 404 を抽出し、先頭10行を確認する2) 5xx（サーバーエラー）の発生件数を数え...
練習問題：ログ解析と監視（実務再現）（Lv3〜4／8問）アクセスログを例に、HTTPステータス集計、URLランキング、時間範囲抽出など“初動対応”を再現する練習問題です。想定時間：各6〜10分目次 1) ステータスコードごとの件数を集計する2) 404 エラーの件数を数える […]...
練習問題：パイプ＆リダイレクト（Lv2〜3／6問）コマンド連携・標準入出力・一時ファイル不要の合成テクニックを鍛えます。想定時間：各3〜6分目次 1) エラーログから ERROR を含む行数を数える2) アクセスログのURLを頻度順に上位5件3) 標準出力はファイル保 […]...
14日で基礎固め｜Linux & Bash独学ロードマップ学習中毒の方、初めまして——忙しくても毎日30〜60分で“実務で使えるLinux & Bash”を14日で身につけたい人のための効率重視プランです。14日間でLinux & Bashの土台を一気に固めるた […]...
練習問題：ファイル操作 8問作成・移動・削除・リネーム・一括処理の基本を固めます。cp / mv / rm / touch / ワイルドカード（*）を中心に練習します。想定レベル：Lv1〜3／目安：各3〜6分...
練習問題：基本操作 8問ターミナルに慣れるための最小限セット。出力確認とファイルの読み書き、表示の基本を押さえます。解答はクリックで展開できます（ショートコードつき）。目次 1) カレントディレクトリの絶対パスを表示する2) practi […]...
練習問題：正規表現ドリル 10問基本から実務でよく使うパターンまで、段階的に正規表現の力を試せる問題集です。郵便番号・メール・バージョン番号・Markdown リンクなど、実務シーンを想定しています。想定レベル：Lv2〜4／目安：各5〜8分目次 1 […]...

1) ファイル内の文字列を一括置換する

2) 先頭に行番号を付けて表示する

3) CSV の 2列目だけを取り出す

4) ログから日付（1列目）を抽出してユニークに並べる

5) ログ内の 404 エラー件数をカウントする

6) ファイルの中から空行を削除する

7) ファイルの中の重複行を削除する（順序は問わない）

8) ソート済みデータから重複行と件数をまとめる

9) エラーログから “ERROR” を含む行だけを抽出し、日時順に並べる

10) CSV の 3列目を合計する

学習のヒント

関連記事