Linuxシェルによる同一文字列のカウント集計

解決済

質問者：mibusys
質問日時：2009/02/25 19:37
回答数：3件

あるファイル中の同じ文字列の行をカウントして
それぞれの文字列が何回現れるか集計するシェルを作ろうとしています。
しかし、最後のグループの集計がうまくいきません。
入力ファイルはソート済みです。
スコープの問題なのかどうか良くわかりませんが、想定外の動きをします。
このシェルの修正もしくは、別のいい集計方法、
どちらでも歓迎です。よろしくお願いします。

書いてみたシェル
------------------
#!/bin/sh

TARGET_STR=`head -n 1 uniqData.txt`
declare -i COUNT=0

cat uniqData.txt | while read LINE_STR
do
if [ "${TARGET_STR}" = "${LINE_STR}" ]; then
COUNT=$COUNT+1
else
echo $TARGET_STR：$COUNT
TARGET_STR=${LINE_STR}
COUNT=1
fi
done

echo $TARGET_STR：$COUNT
------------------

入力ファイル
------------------
asd
asd
asd
dfg
dfg
gghhjj
gghhjj
gghhjj
gghhjj
ttyyuuu
ttyyuuu
ttyyuuu
wwee
------------------

期待出力
------------------
asd：3
dfg：2
gghhjj：4
ttyyuuu：3
wwee：1
------------------

実際の出力
------------------
asd：3
dfg：2
gghhjj：4
ttyyuuu：3
asd：0
------------------

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (3件)

ベストアンサー優先
最新から表示
回答順に表示

No.2ベストアンサー

回答者： OKwebb
回答日時：2009/02/25 21:26

回答としては#1の方法がベストだと思います。

参考までにシェルが希望通りに動作しないのは、
パイプ以降がサブシェルで動作するからです。
多分asdの行数が1行のときもうまくいかないのではないでしょうか？
解決方法としては以下のいずれかが考えられます。
1.変数をexportしてしまう。
2.シェルをbashに変更してwhileの部分も変更する。
while read LINE_STR
do
省略
done < uniqData.txt
3.シェルをkshとかに変更。