文書から単語を検索したい・・・

解決済

質問者：lnekonomel
質問日時：2009/11/13 01:06
回答数：2件

私はRuby初心者になります。
今、私は文字列(文)から文字列（単語）を検索させるプログラムを組みたいのですが、１つ分からない点が出てきたので質問させていただきました。

内容なのですがとりあえず以下のようなプログラムを本などで調べ組上げました。
***********************************************************
open("docu.txt"){|io|
　puts io.read
　io.pos = 0
　File.readlines("word.txt").each{|line|
　　puts line
　　line.chomp!
　　p io.read.index(line)
　}
}
***********************************************************
【docu.txtの内容】
aiueokakikukekosasisuseso

【word.txtの内容】
keko
***********************************************************
結果：
aiueokakikukekosasisuseso
keko
11

これならちゃんと動いてくれました。

ただ、これらのテキストの内容を以下のような日本語にするとうまくいきません。
***********************************************************
【docu.txtの内容】
あいうえおかきくけこさしすせそ

【word.txtの内容】
けこ
***********************************************************
結果：
あいうえおかきくけこさしすせそ
けこ
nil

やはり英数字でないと、うまくいかないようです。

こういった「ひらがな」や「漢字」でも検索してくれるようにするには、どういった作業が必要になるのでしょうか？

よろしくお願いします。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (2件)

ベストアンサー優先
最新から表示
回答順に表示

No.2ベストアンサー

回答者： notnot
回答日時：2009/11/13 20:34

文字コードがおかしいのかと思いましたけど、nil になるのが不審。

OSの種類とRubyのバージョンはなんですか？
ruby -v でバージョンがわかります。

1.8.x の場合は、p $KCODE というスクリプトを実行した結果はどうなりますか？
1.9.x の場合は、p Encoding.default_external というスクリプトを実行した結果はどうなりますか？

docu.txt と word.txt のデータの文字コードはなんですか？

問題点とは関係ありませんが、こういうほうがいいですね。

open("docu.txt"){|io|
　str = io.read
　puts str
　File.readlines("word.txt").each{|word|
　　puts word
　　word.chomp!
　　p str.index(word)
　}
}