プロが教える店舗&オフィスのセキュリティ対策術

日本語を意味的に分割するアルゴリズムが知りたいです。

吾輩は猫である。名前はまだ無い。どこで生れたかとんと見当がつかぬ。

吾輩



ある

名前
...
というように、日本語を最小単位で分割する方法が知りたいのですが、こういうのは簡単にはできないのでしょうか?

PerlやVBAで使いたいのですが参考になるサンプルや書籍などございましたら、教えてください。

A 回答 (2件)

最小コスト法の事だと思います。


http://www.google.co.jp/search?hl=ja&rls=GGLG%2C …

超高速のデーターベース参照エンジンだから、VBAレベルでは無理だと思うけど。
本来ならIMEといわれるプログラムです、プログラムもさることながら
数10万語に及ぶ辞書を作成する事が必要で、個人レベルでは無理です。
    • good
    • 0

 「形態素解析」で、検索してみてください。

色々と難しい話が出てきますが、基本的な知識として覚えておくのもよいかも!!

 実際には、KAKASI,ChaSenなどの有名なソフトを利用するのが良いでしょう。
  http://kakasi.namazu.org/
  http://chasen.naist.jp/hiki/ChaSen/

また、perlで使用するならText::Kakasiが良いかも

  http://search.cpan.org/dist/Text-Kakasi/

参考URL:http://search.cpan.org/dist/Text-Kakasi/
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!