VC++で日本語(マルチバイト)の文字が含まれているファイルを読み込もうと思っています。
例えばunicodeのファイルとして下記の内容があるとして、
11111
abcdef
いろはにほへと
このファイルから1文字ずつ読み込みたいのですが、ヘルプで調べたところfgetwc関数でマルチバイトの読み込みができるということを調べました。
ファイルのオープンは_wfopenを使用しているのですが、テキストモード・バイナリモードでどちらで開いても、fgetwc関数の戻りはファイルを1byte読んだ結果を返します。
半角文字の場合は"1"とか"a"を単純に呼んで、マルチバイト文字であれは"い"とか"ろ"というデータを読み込みたいのですが、どうすればいいでしょうか?
A 回答 (3件)
- 最新から表示
- 回答順に表示
No.3
- 回答日時:
SJIS文字コード表はありませんか。
SJIS文字の第1バイトは、0x81 - 0x9F または、0xE0 - 0xFC,
第2バイトは、0x40 - 0x7E または、0x80 - 0xFC です。
因みに、半角カタカナは、0xA1 - 0xDF です。
残りは、ASCII で、ANSI の判定関数があります。
方眼紙に第1バイトと第2バイトを縦横に書いて、塗りつぶし
見てください。
尚、読みこんだ1バイトが int に格納される場合、一旦
0xFF でマスクして、上記の定数と比較すると安心です。
また、SJIS <-> unicode 変換の API がありますので、
MSDN などで確認されるとよろしいかと思います。
No.2
- 回答日時:
> では、SJISとかだとマルチバイトなので、半角文字は1byte、全角文字は2byteだと思うので、そのような場合はどうすればいいのでしょうか?
まず1byte読めば、それが'半角'か'全角の前半分'かが判別できるはず。後者なら残る1byteを読めばいい。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Excel(エクセル) エクセルのVBAについて とあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
- PDF acrobatでwordファイルをpdfに変換すると文字化けする 3 2023/02/10 09:31
- C言語・C++・C# 至急お願いします。C言語で.imgのファイルを読み込んで1バイトづつ出力するプログラムを作りたいので 3 2023/01/16 22:49
- PostgreSQL ポストグレにあるExcelファイルを開くには 1 2022/12/13 18:07
- Excel(エクセル) 【VBA】指定フォルダに格納中のテキストファイルをエクセルで処理し結果のエクセルを新規フォルダに保存 1 2022/03/25 14:19
- Visual Basic(VBA) エクセルVBAでメールの自動作成の モジュールを作ったのですが、txtファイルから読み込んだ本文が文 2 2022/07/20 15:01
- フリーソフト Windowsの特殊文字を削除や変換したい そんなフリーソフトはありますか? 3 2022/11/09 00:05
- C言語・C++・C# c言語の問題です 2 2023/07/21 10:51
- その他(プログラミング・Web制作) プログラミング python pandas 固定長データの出力 2 2022/08/16 11:22
- Excel(エクセル) csvファイルをExcel形式で読み込むには 2 2023/07/03 13:09
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
10Mバイトて文字数に すると何...
-
COBOLのCOMP形式について
-
UTF-8で5~6バイトになる文字コ...
-
エクセルシート名の制限を変更...
-
バイナリとBCDコード
-
char str[256]の256の意味は?
-
COBOL PICTUREで X,S,Vの意味
-
日付時刻を4バイトに
-
VB6で漢字の1バイト目か2バイト...
-
C/C++の型について
-
Javaで日本語1文字のバイト数
-
バイト列とバイナリ列の違いが...
-
3バイト文字(UTF-8)をprintfで...
-
URLは最高何文字まで可能なので...
-
バイナリファイルのデータから...
-
(C#)1バイトの正規表現
-
VB.NET LeftBの代用
-
最大長を用意せずにバイナリデ...
-
SQLで1バイト、2バイト混在...
-
半角、全角の判別方法
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
UTF-8で5~6バイトになる文字コ...
-
10Mバイトて文字数に すると何...
-
エクセルシート名の制限を変更...
-
COBOLのCOMP形式について
-
char str[256]の256の意味は?
-
バイナリとBCDコード
-
「1TB」のHDDに日本語は何字入...
-
Javaで日本語1文字のバイト数
-
バイト列とバイナリ列の違いが...
-
SQLで1バイト、2バイト混在...
-
ピクセル,dpiから容量(バイト...
-
C++ Builderで文字列をバイトに...
-
64bit対応
-
ワイド文字のバイト数が取得で...
-
UCS-2の一覧表が欲しい
-
3バイト文字(UTF-8)をprintfで...
-
VBAでShift-JISのURLエンコード
-
機種依存文字をチェックしたい。
-
ビットスワップとバイトスワッ...
-
VBSでテキストファイルの文字列...
おすすめ情報