がわかりません。
例えば
>http://e-words.jp/w/E38390E382A4E3838AE383AAE588 …
をみるとバイナリ列は1バイトを連ねたものだというらしいです。
つまり【文】という文字列を文字コードUTF-8でバイト配列化すると
[1] => 230 [2] => 150 [3] => 135
となります。
(これはPHPでunpackかけましたが他の言語のGetBytes()などでも同じバイト値がでました。)
この【文】という文字列はバイナリ列になるわけですよね?
例えばこの【文】という文字だけを保存したbun.txtというファイルはバイナリーファイルに
なるのでしょうか?
バイナリファイルの定義をみると
>http://e-words.jp/w/E38390E382A4E3838AE383AAE383 …
上記URLだと
>文字コードの範囲などを考慮せずに作成されたファイル
というのがバイナリファイルであるとあります。
つまりバイナリファイルとは
1バイト・・つまり8ビット(0~255)までの数値で表したものを連ねたもので
なおかつ、文字コードなどの解釈を一切行わなずに、バイト値のみが記述されたデータと
おもってもよいのでしょうか?
No.3ベストアンサー
- 回答日時:
>
http://e-words.jp/w/E38390E382A4E3838AE383AAE588 …> をみるとバイナリ列は1バイトを連ねたものだというらしいです。
解説者はそんな「1バイトのデータを連ねた塊。」という15文字では説明しきれないと判断したからさらに説明を続けているわけです。「1バイトを連ねたものだというらしいです」なんてそこで勝手に解釈をやめてはダメですよ。
リンク先ではさらに次のような解説が続いています。
--------
扱うデータの型や形式などに立ち入らずに、任意のデータを単なるビットパターンの連なりとして汎用的に処理する場合に用いられるデータ型で、その内容は実際には文字や数値であったり、あるいは画像や音声、機械語のプログラムであったりする。
--------
つまり,その内容が実際には文字であったとしても,データ形式に立ち入らずに単なるビットパターンとして処理すればそれはバイナリ列だと説明しています。
> この【文】という文字列はバイナリ列になるわけですよね?
> この【文】という文字だけを保存したbun.txtというファイルは
> バイナリーファイルになるのでしょうか?
合っているけれど,間違ってもいます。
10進数表記で 230 150 135。2進数表記で 11100110 10010110 10000111 という3バイトを,単なるビットパターンの連なりとして扱うなら,それはバイナリ列であり,それが保存されたファイルは拡張子が何であろうとバイナリファイルです。
しかしそれを,UTF-8データの連なりとして扱うなら(かつ,そのビットパターンがUTF-8形式に正しく準拠していたのなら),それはUTF-8テキスト文字列であり,それが保存されたファイルは拡張子が何であろうとUTF-8テキストファイルです。
(".txt"という拡張子は,その内容がテキストファイルであることを保証するものではなく,ソフトウェアに対して「中身が何かは保証しないけれど,テキストファイルとして扱って欲しい」と指示する働きでしかないので)
質問者が「この【文】という文字列は」「この【文】という文字だけを」と口にしている時点で,すでにその内容が文字として解釈可能なバイト列だということを前提にしています。であるなら,それはテキスト文字列・テキストファイルと呼ぶべきものでしょう。
そして繰り返しますが,そのテキスト文字列・テキストファイルを,データ形式に立ち入らずに単なるビットパターンとして扱えば,それはバイナリ列・バイナリファイルとしても処理できます。
No.2
- 回答日時:
すべてのファイルはバイナリファイルと言えます。
拡張子がTXTやBIN、EXEであっても、バイナリエディタなどで開けば00h~FFh(16進数)の数字の羅列でしかありません。
人間がファイルの中を見て、文字が書いてあるからテキストファイルだなと判別しているだけです。
No.1
- 回答日時:
>この【文】という文字列はバイナリ列になるわけですよね?
使う環境次第……でしょうかね。
# たとえばC言語なら「文字列」として扱う為には終端コードが必要なパターンがほとんどですし。
# ASCIIコード以外の場合だとまち事情が変わるコトもあるでしょうしね。
# wchar_t型の配列で文字列を…ということもあるでしょうし……。
>例えばこの【文】という文字だけを保存したbun.txtというファイルはバイナリーファイルに
>なるのでしょうか?
全てのファイルはバイナリデータの塊でしかありません。
例外的に特定の文字コード(と一部の制御コード)を含むファイルを「テキストファイル」として扱っているだけです。
# 環境によってはそういうテキストファイルを扱い易くしたライブラリなんかもあるでしょう。
# 改行コードなんかは制御コードになりますし(環境によってCR/CR+LF/LFと差異はありますが)、
# JISコードで記録されていれば切替の為のエスケープシーケンスなんかも含むでしょう…。
で……今回のバイナリ列(E6h 96h 87h)だけが記録されたファイルだと……
「UFT-8の文字コードを使用したテキストファイル」という区分にすることも可能でしょう。
もちろん、ただのバイナリファイルとしても扱えますが。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Word(ワード) 表の縦罫線を移動するピッチ 1 2022/10/12 12:24
- 日本語 「文章の使命は読み手に伝わることです。」は悪文ですか? 5 2022/05/14 17:15
- Excel(エクセル) エクセルの文字化けを解除できる方法を教えてください。 5 2022/06/16 20:59
- 歴史学 ロシアの謎の文字”Z”とは?「非常に縁起の良い言葉」……ウクライナはZ旗を掲げたらどうかな? 2 2022/03/26 06:53
- Windows 10 BitLocker 回復キーの入力 1 2022/10/09 15:23
- 楽器・演奏 Jupiter(平原綾香バージョン)の原曲「キー」と、譜の♭の並び数がどうも腑に落ちない 5 2023/06/04 19:43
- 哲学 《太郎ハ花子ガ好きだ》構文から《象は鼻が長い / 僕はウナギだ / コンニャクは太らない》へ 1 2022/05/30 08:48
- 英語 Sidewalks がなぜ複数形なのでしょうか? 2 2022/12/23 05:57
- その他(ニュース・時事問題) 『辺野古 誰も居ないのに日数がカウントされていく不思議な現場』……批判を逆手にとって観光地にしたら? 2 2022/12/13 15:17
- Excel(エクセル) [オートフィルター]機能について 3 2023/02/04 14:32
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
テキストファイルの一部分を抽...
-
テキストファイル内容の、16進...
-
ATTファイルってどうやって開け...
-
テキストファイルの特定行の削...
-
テキストファイル固定長データ...
-
VBA。開いているテキストファイ...
-
C# 文字コード変換
-
[VB.NET] 処理の高速化を行いた...
-
StreamReaderで読み込んだファ...
-
VBscriptでWebサイトから取得し...
-
JFreechartの使い方
-
既存のテキストファイルを開く方法
-
C言語のソースからコメントを抜...
-
C#テキストファイルから1バイト...
-
CSVファイルの時刻の形式について
-
JavaでPDFファイルに変換するに...
-
COBOL FILLER
-
【Excel VBA】取り込んだファイ...
-
accessでクエリをExcelにエクス...
-
GetOpenFileName()について
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
ATTファイルってどうやって開け...
-
Excel VBAが徐々に遅くなる
-
テキストファイルの一部分を抽...
-
既存のテキストファイルを開く方法
-
テキストファイル(英語&日本...
-
VB(VBA)で、バイナリデータを使...
-
パイソンでのテキストデータの...
-
VBA。開いているテキストファイ...
-
テキストファイルの特定行の削...
-
テキストファイル内容の、16進...
-
StreamReaderで読み込んだファ...
-
テキストファイル固定長データ...
-
ファイル変換
-
STM32 Nucleo-F446REでデータを...
-
テキストファイルで一番使われ...
-
エクセルVBAでメールの自動作成...
-
テキストファイルのログをExcel...
-
UTF-8とASCIIコードにおける互...
-
テキストファイル内の文字の有...
-
フォーム無しでアプリを作成す...
おすすめ情報