
A 回答 (5件)
- 最新から表示
- 回答順に表示
No.5
- 回答日時:
この場合の「文字列に読み込む」というのは、例えば
$a = file_get_contents('xxx.doc');
としたら、 xxx.doc のバイナリデータが そのまま $a に文字列型として格納されて、
$a の 5文字目を見ると、元ファイルの5バイト目がわかる、
とか、そんな動作のことです。
「内容を変換」するわけではありません。
No.4
- 回答日時:

No.3
- 回答日時:
> バイナリファイルの構造とありますが、これは可能でしょうか。
もちろん、自力で構造を解析できるならば可能です。マイクロソフト自身から、データ構造に関する完全な説明がなされたことはないため(部分的にはあったらしい)、どうやっても自分で解析するという行為は避けて通れないです。
ちなみに、doc形式はOfficeのバージョンによる変遷があり、その都度構造が変わっています。またdocx形式は実はzip圧縮されていて、拡張子をzipに変更してやると解凍でき、圧縮前の中身が見えます。実は解凍すると中身はXMLになっているから、ある意味これはテキストファイルです。
>どうやっても自分で解析するという行為は避けて通れないです。---
その都度構造が変わっています.
そうですか。難しいということですね。わかりました。

No.2
- 回答日時:
バイナリファイルは、ファイルフォーマットがアプリの数だけあると言っても過言ではなく、そもそもテキストデータを含まないものも多々あります。
また、一見すると無意味な文字の羅列があった場合、それが実はテキストなのか、たまたまテキストのように見えるだけのバイナリなのかを区別することはまず不可能です。それを可能にする方法は唯一つ、そのバイナリファイルの構造を事前に知っていること。なのでそうしたバイナリファイルの中を読み取ってテキストだけをきれいに取り出すのは、アプリの数だけ存在するようなバイナリファイルの構造をすべて事前に知っていなければならない。そんな事が可能だと思いますか?まあ常識的に考えたら無理ですよね。
なのでバイナリファイルに対応したというのはせいぜい、バイナリの中にある0x00(ヌル文字)を見つけた場合にそこを終わりと解釈しないで最後まで読むっていうのと、通常の文字に使用しない範囲の文字コードデータをバイナリとみなして無視するくらいのことが限界です。
いろいろ教えていただきありがとうございます。当方はdoc とdocxのみをテキストに変換したいと思っています。バイナリファイルの構造とありますが、これは可能でしょうか。
No.1
- 回答日時:
バイナリデータに対応しているだけでテキストには変換しません。
http://php.net/manual/ja/function.file-get-conte …
注意: この関数はバイナリデータに対応しています。
>バイナリデータに対応しているだけでテキストには変換しません。
でもサイトを見ると、「文字列に読み込む」とありますが。ではどのようにして変換できるのでしょうか(どのプログラムで)
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(プログラミング・Web制作) python OpenPyXLを使って出力結果をエクセルに書き込み 2 2022/06/04 19:46
- その他(悩み相談・人生相談) 流暢に話すテキスト読み上げアプリ 1 2023/07/23 20:41
- 物理学 量子力学のテキストのフーリエ変換の記述について 1 2022/10/16 17:00
- HTML・CSS GETをPOSTに変更したところ 送信 不能です。 1 2022/04/10 17:31
- その他(Microsoft Office) Excelの条件付き書式についての質問です。 2 2022/09/08 01:25
- Evernote Evernote(エバーノート)の文字化け 1 2022/04/05 19:30
- UNIX・Linux sedでの正規化 2 2022/05/10 11:39
- C言語・C++・C# c言語の問題です 2 2023/07/21 10:51
- FC2ブログ テキスト版からURLも表示できるように設定できないのでしょうか。 ブログにURLを載せようとしたら文 2 2023/02/12 11:20
- フリーソフト 数字を縦長に拡大する方法について 7 2022/11/28 08:23
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
テキストファイルをiCalendar形...
-
VB(VBA)で、バイナリデータを使...
-
テキストファイル内の文字の有...
-
C#テキストファイルから1バイト...
-
テキストファイル固定長データ...
-
ATTファイルってどうやって開け...
-
[VB.NET] 処理の高速化を行いた...
-
テキストファイルの一部分を抽...
-
フォーム無しでアプリを作成す...
-
C言語のソースからコメントを抜...
-
テキストファイルの特定行の削...
-
エクセルVBAでメールの自動作成...
-
テキストファイル内容の、16進...
-
ASP.NET Web上のテキストファ...
-
テキストファイルのログをExcel...
-
UTF-8とASCIIコードにおける互...
-
c言語での単語数のカウント
-
ストリームについて。
-
accessでクエリをExcelにエクス...
-
CSVファイルの時刻の形式について
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
ATTファイルってどうやって開け...
-
テキストファイルの一部分を抽...
-
テキストファイル固定長データ...
-
VB(VBA)で、バイナリデータを使...
-
バイナリデータの中からMidのよ...
-
WORDのVBAで差し込み印刷時、デ...
-
Excel VBAが徐々に遅くなる
-
既存のテキストファイルを開く方法
-
C言語のソースからコメントを抜...
-
VBSでテキストファイルの2行目...
-
エクセルVBAでメールの自動作成...
-
wav ファイルから音声を数値デ...
-
ファイル変換
-
テキストファイル(英語&日本...
-
[VB.NET] 処理の高速化を行いた...
-
テキストファイルをSQLServerデ...
-
VBA。開いているテキストファイ...
-
テキストファイルの特定行の削...
-
VBscriptでWebサイトから取得し...
-
テキストファイルを読んで、Exc...
おすすめ情報