電子書籍の厳選無料作品が豊富!

シフトJIS使用時の日本語のマッチングにおいて
正確なマッチングができないことは分かっているのですが
いわゆるダメ文字が含まれていないにもかかわらず
マッチングがおかしいことがあります。

ちょう、きゅうなど最後「~う」で終わる言葉のマッチングさせると
マッチングするはずがしないのです。
この理由は何が考えられますか?

UTF-8に変換してマッチングさせればいいのは分かっているのですが
どうしてなのかという理由が知りたいので投稿させていただきました。

A 回答 (1件)

使っている Perl のバージョンと実際にそのような挙動が確かめられる例を見せてください.

    • good
    • 0
この回答へのお礼

どうもありがとうございます。
「う」という言葉が含まれる言葉での挙動がおかしいので
ここに質問させていただいたのですが
昨晩よく見ていたところ禁止ワードの判定前に
「、」などを省くようになっており、
「、」はsjisでは1キロバイトで、\xa4は「う」の2バイト目と一致してしまうからでした。
ご迷惑をおかけしてすみませんでした。
また真剣に相談に乗っていただき、ありがとうございました。

お礼日時:2013/08/22 08:21

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!