プロが教えるわが家の防犯対策術!

文字コードがUTF8のファイルがあります。
この中に、SJISで表示できない文字があり、常用漢字?でない文字を判定する方法を探しています。

文字コードに詳しい方教えてください。
アルゴリズムは、perlでもCでも構いません。

A 回答 (2件)

UTF-8→SJISで変換できない漢字をチェックしたいということでしょうか。


だとして、

この場合のSJISというのは本当のSJISか、
WindowsやMacの拡張が入ったSJISか
あるいはさらに別のものですか?

Perlでいうと、Encode::from_toで変換するときに、
変換できない文字をどうするかという指定ができます。
HTML等の数値参照にするとか、Fatal Errorにするとか
ゲタ文字(〓)にするとか。

Cだと使用する変換手段にもよるのでなんとも。
    • good
    • 0

>SJISで表示できない文字があり、


>常用漢字?でない文字を判定する方法
SJISの範囲を調べたいの?
常用漢字を調べたいの?

後者なら一覧を作成して索引として引くしかない
http://www.google.co.jp/search?q=%E5%B8%B8%E7%94 …




の筈・・・
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!