リストの単語がテキストファイルで何回出てくるか

締切済

質問者：parade77
質問日時：2008/09/05 10:50
回答数：3件

「人の苗字＋改行」がたくさん入力されているname.txtと
「苗字が登場する会話文」がたくさん入力されているconv.txtの
二つのファイルがあります。

【name.txt】
鈴木
田中
佐藤
・・・

【conv.txt】
昨日の山田さんの話によれば、明日は佐藤さんが担当だそうだ。
京都の中山君が来たときに荷物を届けてほしい。
・・・

これらname.txtのそれぞれが、conv.txt全体で何回出てきたかを求めるprelのプログラムを作りたいのですが、どのようにしたら良いでしょうか。
アウトプットは
鈴木　256
田中　982
佐藤　157
・・・
となるようにしたいと思っています。
皆さまのお知恵をお貸しくださいませ。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (3件)

最新から表示
回答順に表示

No.3

回答者： M_Sato
回答日時：2008/09/06 11:00

この課題で検索のアルゴリズムを考えるときは、以下の点に留意したほうがいいでしょう。

・二重カウント（「森」さんは「森田」さんでもヒットしてしまいます）
・苗字と普通名詞・地名等との区別（「川原で」「上野駅」など）

- 0
- 件

通報する

No.2

回答者： sakusaker7
回答日時：2008/09/05 14:36

> なんとなく、処理内容はイメージできていたのですが、

> 具体的なスクリプトはどのようになるでしょうか。
>
>name.txtもconv.txtも、数万行のオーダーになっていまして、
>どのようにすれば速いか、というのも気になっています。

まず自分のイメージをコードにしてみて、そこで問題が出ているのなら
それを聞くべきではないでしょうか。

これじゃ丸投げ。