
A 回答 (5件)
- 最新から表示
- 回答順に表示
No.5
- 回答日時:
この場合の「文字列に読み込む」というのは、例えば
$a = file_get_contents('xxx.doc');
としたら、 xxx.doc のバイナリデータが そのまま $a に文字列型として格納されて、
$a の 5文字目を見ると、元ファイルの5バイト目がわかる、
とか、そんな動作のことです。
「内容を変換」するわけではありません。
No.4
- 回答日時:

No.3
- 回答日時:
> バイナリファイルの構造とありますが、これは可能でしょうか。
もちろん、自力で構造を解析できるならば可能です。マイクロソフト自身から、データ構造に関する完全な説明がなされたことはないため(部分的にはあったらしい)、どうやっても自分で解析するという行為は避けて通れないです。
ちなみに、doc形式はOfficeのバージョンによる変遷があり、その都度構造が変わっています。またdocx形式は実はzip圧縮されていて、拡張子をzipに変更してやると解凍でき、圧縮前の中身が見えます。実は解凍すると中身はXMLになっているから、ある意味これはテキストファイルです。
>どうやっても自分で解析するという行為は避けて通れないです。---
その都度構造が変わっています.
そうですか。難しいということですね。わかりました。

No.2
- 回答日時:
バイナリファイルは、ファイルフォーマットがアプリの数だけあると言っても過言ではなく、そもそもテキストデータを含まないものも多々あります。
また、一見すると無意味な文字の羅列があった場合、それが実はテキストなのか、たまたまテキストのように見えるだけのバイナリなのかを区別することはまず不可能です。それを可能にする方法は唯一つ、そのバイナリファイルの構造を事前に知っていること。なのでそうしたバイナリファイルの中を読み取ってテキストだけをきれいに取り出すのは、アプリの数だけ存在するようなバイナリファイルの構造をすべて事前に知っていなければならない。そんな事が可能だと思いますか?まあ常識的に考えたら無理ですよね。
なのでバイナリファイルに対応したというのはせいぜい、バイナリの中にある0x00(ヌル文字)を見つけた場合にそこを終わりと解釈しないで最後まで読むっていうのと、通常の文字に使用しない範囲の文字コードデータをバイナリとみなして無視するくらいのことが限界です。
いろいろ教えていただきありがとうございます。当方はdoc とdocxのみをテキストに変換したいと思っています。バイナリファイルの構造とありますが、これは可能でしょうか。
No.1
- 回答日時:
バイナリデータに対応しているだけでテキストには変換しません。
http://php.net/manual/ja/function.file-get-conte …
注意: この関数はバイナリデータに対応しています。
>バイナリデータに対応しているだけでテキストには変換しません。
でもサイトを見ると、「文字列に読み込む」とありますが。ではどのようにして変換できるのでしょうか(どのプログラムで)
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
テキストファイルの一部分を抽...
-
ATTファイルってどうやって開け...
-
テキストファイル内容の、16進...
-
StreamReaderで読み込んだファ...
-
VBAでUTF-8テキストファイル作...
-
Excel VBAが徐々に遅くなる
-
ストリームについて。
-
VB(VBA)で、バイナリデータを使...
-
Zbarというソフトについて
-
RGBデータからBMP画像へ
-
既存のテキストファイルを開く方法
-
ASP.NET Web上のテキストファ...
-
accessでクエリをExcelにエクス...
-
コマンドプロンプトのテキスト...
-
Thunderbird 受信メールからの...
-
iTextでPDFを表示させたら日本...
-
Acrobat参照設定
-
CSVファイルの時刻の形式について
-
Aviutlというソフトのプラグイ...
-
0バイトのテキストファイル
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
ATTファイルってどうやって開け...
-
テキストファイルの一部分を抽...
-
テキストファイル固定長データ...
-
VB(VBA)で、バイナリデータを使...
-
バイナリデータの中からMidのよ...
-
WORDのVBAで差し込み印刷時、デ...
-
Excel VBAが徐々に遅くなる
-
既存のテキストファイルを開く方法
-
C言語のソースからコメントを抜...
-
VBSでテキストファイルの2行目...
-
エクセルVBAでメールの自動作成...
-
wav ファイルから音声を数値デ...
-
ファイル変換
-
テキストファイル(英語&日本...
-
[VB.NET] 処理の高速化を行いた...
-
テキストファイルをSQLServerデ...
-
VBA。開いているテキストファイ...
-
テキストファイルの特定行の削...
-
VBscriptでWebサイトから取得し...
-
テキストファイルを読んで、Exc...
おすすめ情報