プロが教える店舗&オフィスのセキュリティ対策術

やりたいことはPerlやPHPなどのサーバーサイドスクリプト上で、ひとつのランダムな日本語の単語を得る、ということです。

あらかじめデータベースにいれておきそこから取得しても、毎回どこかのAPIか何らかのサービスにアクセスして取得してもどちらでもいいです。

できれば後者の方が楽なのですが、一通り調べたところ、直接この要望に答えてくれそうなサービスはありませんでした。しかし、たとえば辞書サイトなどをうまく使えばいけそうな気がします。どのようにすればランダムな単語を簡単に得られるでしょうか?

あるいは前者のあらかじめデータベース化しておくという方法についても、こうすれば簡単に大量の単語を取得できるよ、というのがありましたら教えてください。

ちなみに、perlを使ったスクレイピングは経験があります。
それから、これに関連した言語としてはphpとperlとmySQLしかやったことないので、できればその範囲内でおねがいします。

A 回答 (1件)

パッと思いつくのは、



1.ランダムな単語を/usr/share/dict/wordsからとってくる。

FreeBSDだと上記パスに24万語ほど単語が登録されています。
Linuxでも似たような辞書はどこかにあると思います。

2.1で拾った単語を辞書サイトで日本語に変換する。

perlでスクレイピングのご経験があるんでしたら、これも簡単かと思います。
2で日本語化するときに単語としての精度がよくなければ、
kakasiというライブラリで分かち書きもできるはずです。
    • good
    • 0
この回答へのお礼

回答ありがとうございます。
灯台下暗しですね。
自前にそんなものがあるとはおもいませんでした。

それを使ってできるかどうか調査してみたいと思います。

お礼日時:2008/10/20 18:10

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!