VC++で日本語(マルチバイト)ファイルの読み込み

締切済

質問者：osakana-manbou
質問日時：2004/03/05 01:29
回答数：3件

VC++で日本語(マルチバイト)の文字が含まれているファイルを読み込もうと思っています。

例えばunicodeのファイルとして下記の内容があるとして、
11111
abcdef
いろはにほへと

このファイルから1文字ずつ読み込みたいのですが、ヘルプで調べたところfgetwc関数でマルチバイトの読み込みができるということを調べました。
ファイルのオープンは_wfopenを使用しているのですが、テキストモード・バイナリモードでどちらで開いても、fgetwc関数の戻りはファイルを1byte読んだ結果を返します。

半角文字の場合は"1"とか"a"を単純に呼んで、マルチバイト文字であれは"い"とか"ろ"というデータを読み込みたいのですが、どうすればいいでしょうか？

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (3件)

最新から表示
回答順に表示

No.3

回答者： mcWalker
回答日時：2004/04/06 23:33

SJIS文字コード表はありませんか。

SJIS文字の第1バイトは、0x81 - 0x9F または、0xE0 - 0xFC,
第2バイトは、0x40 - 0x7E または、0x80 - 0xFC です。
因みに、半角カタカナは、0xA1 - 0xDF です。
残りは、ASCII で、ANSI の判定関数があります。
方眼紙に第1バイトと第2バイトを縦横に書いて、塗りつぶし
見てください。
尚、読みこんだ1バイトが int に格納される場合、一旦
0xFF でマスクして、上記の定数と比較すると安心です。
また、SJIS <-> unicode 変換の API がありますので、
MSDN などで確認されるとよろしいかと思います。