
「人の苗字+改行」がたくさん入力されているname.txtと
「苗字が登場する会話文」がたくさん入力されているconv.txtの
二つのファイルがあります。
【name.txt】
鈴木
田中
佐藤
・・・
【conv.txt】
昨日の山田さんの話によれば、明日は佐藤さんが担当だそうだ。
京都の中山君が来たときに荷物を届けてほしい。
・・・
これらname.txtのそれぞれが、conv.txt全体で何回出てきたかを求めるprelのプログラムを作りたいのですが、どのようにしたら良いでしょうか。
アウトプットは
鈴木 256
田中 982
佐藤 157
・・・
となるようにしたいと思っています。
皆さまのお知恵をお貸しくださいませ。
A 回答 (3件)
- 最新から表示
- 回答順に表示
No.3
- 回答日時:
この課題で検索のアルゴリズムを考えるときは、以下の点に留意したほうがいいでしょう。
・二重カウント(「森」さんは「森田」さんでもヒットしてしまいます)
・苗字と普通名詞・地名等との区別(「川原で」「上野駅」など)
No.2
- 回答日時:
> なんとなく、処理内容はイメージできていたのですが、
> 具体的なスクリプトはどのようになるでしょうか。
>
>name.txtもconv.txtも、数万行のオーダーになっていまして、
>どのようにすれば速いか、というのも気になっています。
まず自分のイメージをコードにしてみて、そこで問題が出ているのなら
それを聞くべきではないでしょうか。
これじゃ丸投げ。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
ファイル名に日付を入れてアッ...
-
ExcelをCSV書き出す場合のシー...
-
VBAでCSVファイルを途中行まで...
-
エクセルVBA コードが同じでも...
-
MATLAB グローバル変数の宣言
-
vba dir の相対パス
-
MATLABのm-fileについて
-
readdir()で得られるファイル・...
-
フォルダが開かなくなりました。
-
batファイルでrenameができませ...
-
window.open でのファイル指定方法
-
CSVが可変長の場合の検索方法
-
全角と半角文字が混在している...
-
read() on unopened filehandle...
-
MATLAB std::exceptionエラー
-
重複するデータを抽出できる秀...
-
dos変数の%~dp0は powershellで...
-
バッチファイルで、記号を含む...
-
ファイル名と更新日付の取得に...
-
VB6で"r"みたいな文字が返って...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
テキストファイルの各行を配列...
-
【Javascript】改行されていな...
-
連番のファイルを何個も開きたい
-
特定のデータを更新する
-
Perlのワンライナーをスクリプ...
-
Perl Grepについて
-
「パスが見つかりません」とい...
-
Pythonでegrep機能をつかいたい
-
C++でのテキストファイル読み込...
-
ファイルから検索条件を読み込...
-
perlでCSVをソートする方法につ...
-
ファイル読み込みマッチングに...
-
どなたか教えて下さい。
-
VBSの処理について
-
Perl テキスト処理について
-
***.cgiの中身は第三者から見ら...
-
バッチファイルでテキストファ...
-
ファイル名に日付を入れてアッ...
-
perl での文章の取得について
-
ファイル名を複数個配列で確保...
おすすめ情報