アプリ版:「スタンプのみでお礼する」機能のリリースについて

C初心者です。
Mecabである文章の形態素解析を行ったのですが、そこから出現回数を調べたいのです。
形態素解析の結果が(テキスト文書で出力すると)
例)------
10名詞,数,*,*,*,*,*
年名詞,接尾,助数詞,*,*,*,年,ネン,ネン
の助詞,連体化,*,*,*,*,の,ノ,ノ
歳月名詞,一般,*,*,*,*,歳月,サイゲツ,サイゲツ
と助詞,並立助詞,*,*,*,*,と,ト,ト
--------
のように余分な文字(名詞etc..)が入っているのでどうしたらよいのか分りません。
テキストファイル(またはcsvファイル)から読み込んで、一般名詞だけ頻度計算を行うにはどのようなプログラムを書けばよいのでしょうか?

過去の質問を読んでも、いらないものを省く方法が分からなかったもので。よろしくお願いします。

A 回答 (1件)

結果を一行ずつ解析して、



> 歳月 名詞,一般,*,*,*,*,歳月,サイゲツ,サイゲツ

のように「単語 名詞,一般...」の書式になってるとこだけ計算対象とすればよいのでは。
方法としてはいらないものを「省く」んではなく「無視する」やり方ですが。
    • good
    • 0
この回答へのお礼

ありがとうございます。
分けて計算していけばいいのですね!

お礼日時:2008/11/19 16:40

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!