
A 回答 (5件)
- 最新から表示
- 回答順に表示
No.5
- 回答日時:
この場合の「文字列に読み込む」というのは、例えば
$a = file_get_contents('xxx.doc');
としたら、 xxx.doc のバイナリデータが そのまま $a に文字列型として格納されて、
$a の 5文字目を見ると、元ファイルの5バイト目がわかる、
とか、そんな動作のことです。
「内容を変換」するわけではありません。
No.4
- 回答日時:

No.3
- 回答日時:
> バイナリファイルの構造とありますが、これは可能でしょうか。
もちろん、自力で構造を解析できるならば可能です。マイクロソフト自身から、データ構造に関する完全な説明がなされたことはないため(部分的にはあったらしい)、どうやっても自分で解析するという行為は避けて通れないです。
ちなみに、doc形式はOfficeのバージョンによる変遷があり、その都度構造が変わっています。またdocx形式は実はzip圧縮されていて、拡張子をzipに変更してやると解凍でき、圧縮前の中身が見えます。実は解凍すると中身はXMLになっているから、ある意味これはテキストファイルです。
>どうやっても自分で解析するという行為は避けて通れないです。---
その都度構造が変わっています.
そうですか。難しいということですね。わかりました。

No.2
- 回答日時:
バイナリファイルは、ファイルフォーマットがアプリの数だけあると言っても過言ではなく、そもそもテキストデータを含まないものも多々あります。
また、一見すると無意味な文字の羅列があった場合、それが実はテキストなのか、たまたまテキストのように見えるだけのバイナリなのかを区別することはまず不可能です。それを可能にする方法は唯一つ、そのバイナリファイルの構造を事前に知っていること。なのでそうしたバイナリファイルの中を読み取ってテキストだけをきれいに取り出すのは、アプリの数だけ存在するようなバイナリファイルの構造をすべて事前に知っていなければならない。そんな事が可能だと思いますか?まあ常識的に考えたら無理ですよね。
なのでバイナリファイルに対応したというのはせいぜい、バイナリの中にある0x00(ヌル文字)を見つけた場合にそこを終わりと解釈しないで最後まで読むっていうのと、通常の文字に使用しない範囲の文字コードデータをバイナリとみなして無視するくらいのことが限界です。
いろいろ教えていただきありがとうございます。当方はdoc とdocxのみをテキストに変換したいと思っています。バイナリファイルの構造とありますが、これは可能でしょうか。
No.1
- 回答日時:
バイナリデータに対応しているだけでテキストには変換しません。
http://php.net/manual/ja/function.file-get-conte …
注意: この関数はバイナリデータに対応しています。
>バイナリデータに対応しているだけでテキストには変換しません。
でもサイトを見ると、「文字列に読み込む」とありますが。ではどのようにして変換できるのでしょうか(どのプログラムで)
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(プログラミング・Web制作) python OpenPyXLを使って出力結果をエクセルに書き込み 2 2022/06/04 19:46
- その他(悩み相談・人生相談) 流暢に話すテキスト読み上げアプリ 1 2023/07/23 20:41
- 物理学 量子力学のテキストのフーリエ変換の記述について 1 2022/10/16 17:00
- HTML・CSS GETをPOSTに変更したところ 送信 不能です。 1 2022/04/10 17:31
- その他(Microsoft Office) Excelの条件付き書式についての質問です。 2 2022/09/08 01:25
- Evernote Evernote(エバーノート)の文字化け 1 2022/04/05 19:30
- UNIX・Linux sedでの正規化 2 2022/05/10 11:39
- C言語・C++・C# c言語の問題です 2 2023/07/21 10:51
- FC2ブログ テキスト版からURLも表示できるように設定できないのでしょうか。 ブログにURLを載せようとしたら文 2 2023/02/12 11:20
- フリーソフト 数字を縦長に拡大する方法について 7 2022/11/28 08:23
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
PHP8でWarning:Undefined varia...
-
composerをインストールしたい...
-
phpの問い合わせフォームを作っ...
-
配列の値の更新方法について
-
PHPの構文で間違えが分からない
-
SFTPなどは使わないホームペー...
-
$_SESSIONに渡した後はそのまま...
-
($_POST['email']??"", ・・・...
-
phpのエラーについて
-
PHP MySql 画像を取得
-
marginの値でマイナス値を設定...
-
submitで思うようにページが遷...
-
HTML PHP ラジオボタンのイベント
-
php でqiitaのサイトにあったフ...
-
SplFileObject を利用したとき...
-
PHPの勉強してます。 配列のと...
-
BASIC認証のフォームをデザイン...
-
アップロードファイルを表示す...
-
複数のパソコンの中の1つのパソ...
-
返信機能のツリー構造の深さを...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
phpの問い合わせフォームを作っ...
-
composerをインストールしたい...
-
PHP8でWarning:Undefined varia...
-
marginの値でマイナス値を設定...
-
phpでcookieがうまく保存されない
-
SplFileObject を利用したとき...
-
PHPSpreadsheetを使って関数を...
-
PHPSpreadsheetによる書き出し...
-
PHP8を使うと、大量のWarningが...
-
フォームで戻った際に入力済み...
-
PostgreSQLからCSV形式でエクス...
-
PHPを使って、別サイトの一部を...
-
BASIC認証のフォームをデザイン...
-
入力した部分を表示させたまま...
-
【初心者】XAMPPのapacheの(恐...
-
ログイン機の付きの掲示板サイ...
-
ワードプレスサイト PHP8.0.25...
-
Postgresの特定のカラムからス...
-
PHPで画像の渡しが上手く行きま...
-
PHPの勉強してます。 配列のと...
おすすめ情報