プロが教えるわが家の防犯対策術!

ちょっと不思議に思ったので質問させてください。

たとえば、『富士山周辺の温泉』を検索したいときに、
・「富士山(スペース)温泉」
・「富士山温泉」
と検索する場合、結果が違うのはわかりますが。

・「富士山(スペース)温泉」
で検索したとき、『富士山温泉』という名称のものが検索にHITしません。
(別の語ですが。)

2ヶ月くらい前?までは検索されていたのですが、最近になって出なくなったように見受けられます。
それまでは、スペースが「半角」「全角」でも結果が違っていて、「全角」で検索した際にだけ出ていました。

スペースを挿入するのは、検索される語が、
『富士山の温泉』だったり、『温泉(富士山)』のように連続した単語でない可能性があり、『富士山温泉』はスペースがあろうがなかろうが検索される、と習った(?)のですが、そもそも、その教えられ方が間違っていたのか、検索エンジンでの検索方法(またはHIT方式)が変わってしまったのか自分にはわかりません。

どなたか、ご存知の方がいらしたら教えてください。

A 回答 (1件)

Yahoo!の検索エンジンの仕様が公開されていないので確かなことは言えませんが、現象から考えて形態素解析のミスである可能性が高いように思います。



検索エンジンというのは決して字面をそのまま検索しているわけではなく、形態素(≒単語)の単位で処理されているというのはご存知でしょうか? 上の例の場合、"富士山温泉"を"富士山"と"温泉"という二つの形態素に分割し、「"富士山"と"温泉"を含むページ」としてURLを覚えておくわけです。

ここで、形態素解析がミスをして"富士"と"山温"と"泉"のように区切りを間違えたとします。これでも"富士山温泉"で検索する分には問題ありません。検索キーワードも同じように切り間違えるからです。

しかし、"富士山(スペース)温泉"で検索された場合は事情が変わります。間にスペースが入っているので、この検索キーワードは「"富士山"と"温泉"を含むページを探せ」と解釈されます。したがって"富士"と"山温"と"泉"と解釈されたページはヒットしないことになります。

ではなぜ、このような現象が急に起こったか、ということですが、これはおそらく辞書のメンテナンスの影響でしょう。日本語にはどんどん新語が現れるので、形態素解析に使用する辞書は定期的にメンテナンスをしなければなりません。今回の現象はそのメンテナンスが裏目に出たのでしょう。将来解決するかどうかはわかりません。
    • good
    • 0
この回答へのお礼

ありがとうございました。
そういうことらしい(?)のでしょうね。

これに限らず、最近の検索のほうがしにくくなったような気がしてならなかったので・・・。

どうもありがとうございました。

お礼日時:2006/05/11 16:19

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!