ファイルのテキストの中の文字列はどのような型で宣言されているか、
わかる人がいたら教えてください。
例えば、fopenでFILE宣言しているstreamにおとして、streamの中から1文字を
とる時にfgetcでintのiに入れますよね。この文字をprintするときに%cとやったら
ここで、型がint→charに変わってちゃんと表示されるのはわかるのですけれど、SJISの日本語2バイトからなっている物ではそれぞれの情報をi[0],i[1]に格納してそれぞれをchar型に変換して連続して表示しなければならない。そうすると、intが16ビットだとすると(32ビットの時もあるらしいので)、テキストファイルでは1文字が16ビット連続で表されているはずなのに、streamから16bitずつひっぱて8bitに直してから、また、連続して表示しなければ、出力ができないんですよ。
これはテキストファイルからstramのときに1文字の1byteにまた1byteが自動的に
てういているように感じるのですけれど、もし、わかる人がいたら教えてください。説明がわかりずらいですけれど。。。。
No.1ベストアンサー
- 回答日時:
ファイルの中身はどんな場合でもただの1byte単位の数字の羅列にすぎません。
そこには型の情報はありません。
2byteで一文字というのは読み出して使うプログラム側で管理する必要があります。
根本的な勘違いは、fgetc の働きにあります。
fgetc はファイルから 1byte(1文字ではない)を取り出すという関数でしかありません。2byteとってることはしないと言うことです。
戻り値はintですが、この時点ではまだ「文字」として扱っているわけではありません。
int(これが2byteでも4byteでも同じで)の変数の中に1byteの数字を入れているだけです。
だから、charに型キャストするんです。このキャストで上位バイトは捨てられます。
マルチバイト文字を扱うのでしたら、fgetwcという関数があります。こちらは1文字拾ってきてくれます。
(返す値は wint_t 型になります)
No.3
- 回答日時:
まず、fgetcで読み出すのは、ファイルの中に存在しているデータの1バイトのみです。
2バイト文字が入っていても、1バイトのデータしか読み出しません。
従って、出力される(ここでの場合変数i)データは1バイト分のデータのみです。出力が16bit(2バイト)であっても2バイトの情報は読み出されません。
関数仕様をもっと理解されて方がよろしいかと思います。
No.2
- 回答日時:
MS-DOSのOS系では通常テキストファイルの英数字文字は1文字を16進2桁で表され、それが間断なく続きます。
日本語などの漢字では英数字分2文字分を使用します。
ところが、C言語の処理系がつくられたころ、日本語は考慮されていませんでした。
(というか、外人が考案したものですから)
ですので、文字をいれるのに都合の良い1Byte変数を用意したわけです。
それがおわかりのようにchar型ですね。
そこで、日本語を使用するために2Byte文字使用するわけですが、
ここで、落とし穴があります。
** 重要 **
使用するOSによって、2Byte文字、つまり、int型の内容が1Byte区切りで反転しているものがあるのです。
いわゆるリトルエンディアンというもので、
これはintel系のマシンで採用されています。
具体的にいうと、int型は16bitで、16進数値が2文字入ります。
そこで、1234Hというものを表現するとき、1Byte目に34H、2Byte目に12Hをセットしなくてはなりません。
ところが、文字コードの場合、1Byte目に12H、2Byte目に34Hと表現しなくてはならないのです。
まとめると、テキストをプログラムの数字変数(integer)に2byteずつセットすると、必ず1byte毎に反転してしまのです。
たぶん、それが原因の事象だと思います。
尚、intel系はリトルエンディアンといい、反転しないのをビッグエンディアンといいます。
相互に変換することをエンディアン変換といいます。
それと、intが16bitしかつかわないのは16bitパソコンの名残であり、unix系など32bitOSはintが32bit使用します。
質問が悪かったです。聞きたいことが違っていましたけれど、知らない貴重な情報提供と協力してもらえたことに感謝します。ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- C言語・C++・C# c言語 プログラムのエラー 1 2023/02/11 20:31
- C言語・C++・C# c言語 int temp = 0; if(isdigit(arr[i])){ temp=arr[i] 2 2022/03/27 01:44
- C言語・C++・C# プログラミングの問題です。至急教えてください。 /***から***/の部分をプログラミングにしてほし 1 2022/10/13 11:48
- C言語・C++・C# このプログラミング誰か教えてくれませんか 1 2022/06/02 15:27
- C言語・C++・C# str[j++]の意味 2 2022/08/30 16:20
- C言語・C++・C# c言語の問題の説明、各所ごとに 5 2023/07/26 11:03
- C言語・C++・C# 宣言する関数の形が決まっている状態で、 str1とstr2の文字列をこの順に引っ付けてstrに保存し 2 2022/05/30 18:21
- C言語・C++・C# C言語初心者 構造体 課題について 2 2023/03/10 19:48
- C言語・C++・C# C言語のエラーについて 2 2022/07/11 13:56
- C言語・C++・C# c言語 コマンドライン引数 4 2023/02/09 18:47
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・プリン+醤油=ウニみたいな組み合わせメニューを教えて!
- ・タイムマシーンがあったら、過去と未来どちらに行く?
- ・遅刻の「言い訳」選手権
- ・【大喜利】【投稿~11/12】 急に朝起こしてきた母親に言われた一言とは?
- ・好きな和訳タイトルを教えてください
- ・うちのカレーにはこれが入ってる!って食材ありますか?
- ・好きな「お肉」は?
- ・あなたは何にトキメキますか?
- ・おすすめのモーニング・朝食メニューを教えて!
- ・「覚え間違い」を教えてください!
- ・とっておきの手土産を教えて
- ・「平成」を感じるもの
- ・秘密基地、どこに作った?
- ・【お題】NEW演歌
- ・カンパ〜イ!←最初の1杯目、なに頼む?
- ・一回も披露したことのない豆知識
- ・これ何て呼びますか
- ・初めて自分の家と他人の家が違う、と意識した時
- ・「これはヤバかったな」という遅刻エピソード
- ・これ何て呼びますか Part2
- ・許せない心理テスト
- ・この人頭いいなと思ったエピソード
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・ハマっている「お菓子」を教えて!
- ・【大喜利】【投稿~11/1】 存在しそうで存在しないモノマネ芸人の名前を教えてください
- ・好きなおでんの具材ドラフト会議しましょう
- ・餃子を食べるとき、何をつけますか?
- ・あなたの「必」の書き順を教えてください
- ・ギリギリ行けるお一人様のライン
- ・10代と話して驚いたこと
- ・つい集めてしまうものはなんですか?
- ・自分のセンスや笑いの好みに影響を受けた作品を教えて
- ・【お題】引っかけ問題(締め切り10月27日(日)23時)
- ・大人になっても苦手な食べ物、ありますか?
- ・14歳の自分に衝撃の事実を告げてください
- ・【大喜利】【投稿~10/21(月)】買ったばかりの自転車を分解してひと言
- ・ホテルを選ぶとき、これだけは譲れない条件TOP3は?
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・【コナン30周年】嘘でしょ!?と思った○○周年を教えて【ハルヒ20周年】
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
テキストファイル固定長データ...
-
既存のテキストファイルを開く方法
-
ATTファイルってどうやって開け...
-
エクセルのマクロについて教え...
-
StreamReaderで読み込んだファ...
-
テキストファイルの一部分を抽...
-
VBSでテキストファイルの2行目...
-
ハングル語のテキスト変換で困...
-
テキストファイルの特定行の削...
-
フォーム無しでアプリを作成す...
-
文字コードの変換(JISコードへ)
-
メールの添付ファイル
-
テキストファイルをSQLServerデ...
-
C#で大容量ファイルの一部編集
-
VB(VBA)で、バイナリデータを使...
-
RGBデータからBMP画像へ
-
バッファとテキストファイル比...
-
Visual Studio 2013で入力ファ...
-
CGIでテキストファイルの中身を...
-
txtファイルをブラウザで閲覧さ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
ATTファイルってどうやって開け...
-
テキストファイルの一部分を抽...
-
既存のテキストファイルを開く方法
-
テキストファイルの特定行の削...
-
StreamReaderで読み込んだファ...
-
VB(VBA)で、バイナリデータを使...
-
Excel VBAが徐々に遅くなる
-
VBSでテキストファイルの2行目...
-
C言語のソースからコメントを抜...
-
テキストファイルをSQLServerデ...
-
[VB.NET] 処理の高速化を行いた...
-
テキストファイル固定長データ...
-
テキストファイル内容の、16進...
-
EXCEL VBAでカンマ区切りテキス...
-
エクセルVBAでメールの自動作成...
-
ストリームについて。
-
WORDのVBAで差し込み印刷時、デ...
-
ファイルの中身
-
文字コードの変換(JISコードへ)
-
Google検索履歴のテキストファ...
おすすめ情報