

いつもお世話になります。
今、検索について学習しているのですが、
文字列検索の場合はstrstrなどを使用すれば
検索できることは理解できました。
しかし、バイナリファイルの検索について理解できていません。
もし、バイナリ(画像や動画etc)ファイルの
中身を解析したい場合、
(1)JPEGなどのバイナリファイルを開く場合、fopen()でひらいてもいいのでしょうか?その他の方法ありますか?
(2)バイナリファイルを開いた後、バイナリファイルの
0xfffeなど指定する値の検索がしたい場合は
どのように検索したらいいのでしょうか?
関数や方法などありましたら教えてください。
どうぞよろしくお願い致します。

No.3ベストアンサー
- 回答日時:
fopen(filename, "rb") でオープンできますね(Unix系のOSなら改行などの変更はしなくていいので "r" だけでも同じでしょうけど)。
1バイトが8ビットとして、「0xfffe を検索したい」という意味が、0xff の次のアドレス位置に 0xfe があるのを見つけたいというのであれば、エラー処理は省いて書くと、
long search(FILE *fp) /* 0xff 0xfe を検索し、その位置を返す */
{
int m = 0;// マッチ状態: 0 or 1
unsigned char c;
while (fread(&c, 1, 1, fp) == 1) {
switch (c) {
case 0xff:
if (m == 0) ++m;
else m = 0;
break;
case 0xfe:
if (m == 1) return ftell(fp);
m = 0;
break;
}
}
return -1L;/* 適当に選んだ、無さそうな位置の値 */
}
でいいのではないでしょうか。通常、入出力ライブラリ内でバッファリングがされ、システムコールが fread() 呼び出しごとに呼び出されることがないので、そんなに遅くはならないでしょう。一バイト読み出すごとに fread() を呼ぶのでは関数呼び出しのオーバヘッドが大きすぎるのであれば、自分でバッファ管理するのがいいですけどね。
ただし、0xfffe など複数バイトの値の検索では、ファイルのフォーマットにもよりますが、CPUのバイトのアドレス付け順序が関係してくるかもしれませんね。たとえば、0xfffe が 16 ビット short の値であり、リトルエンディアンのCPUであったなら、0xfe を見つけてから 0xff を見つけるようにしないとなりません。もちろん、16 ビット short の値で、ファイルの内容がすべて short のバイナリ値なのであれば、fread で short の変数をバッファにして読み出して比較するだけ(逆に2つの short を跨いで比較してはいけない)ですけどね。
No.2
- 回答日時:
そのものズバリの答えは書きません。
自分で考える力をつけてもらうためのヒントだけ書きます。
(1)JPEGなどのバイナリファイルを開く場合、fopen()でひらいてもいいのでしょうか?その他の方法ありますか?
fopenを"rb"でオープンすれば問題ありません。
ただし、fgetsしないこと。
必ずfreadで読み出しましょう。
(2)バイナリファイルを開いた後、バイナリファイルの0xfffeなど指定する値の検索がしたい場合はどのように検索したらいいのでしょうか?関数や方法などありましたら教えてください。
専用の関数はありませんので、strstrに似た処理を自前でやりましょう。
unsigned char buff[256];
というバッファに読み込んだら、
for( i=0 ; i<(256-1) ; i++ ) {
if( (buff[i]==0xff) && (buff[i+1]==0xfe) ) {
// 該当する0xfffeコードが見つかった!
}
}
で1バイトづつ検査していきます。これをbuffにfreadできる限り繰り返します。
ただし、このプログラムのままでは256バイト目に0xffと257バイト目に0xfeがあるとバッファが別になってしまうので検索されません。
一括でファイル内容全部をバッファに読み込むか、プログラムの工夫が必要です。
プログラムの工夫は、1つはダブルバッファにする。もうひとつは、比較するのが2バイトだけなら2バイトのバッファを別に持ちます。
No.1
- 回答日時:
「メモリブロックどうしの比較」なら memcmp なんだけど....
JPEG なんかだと圧縮されていることも多いので, 単純に「指定したデータ」を見付けるだけでは無意味かもしれないですね.
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
バイナリ形式のXMLファイルを読...
-
バイナリファイルの比較につい...
-
FTPを使わないファイルアップロ...
-
FTP転送
-
バイナリーデータの一部データ...
-
VBA バイナリ―から文字列にす...
-
C言語初心者の質問失礼します。
-
vba ActiveSheet.pasteを使った...
-
LSI C-86 v3.30c 試食版について
-
ExcelVBAでカレントディレクト...
-
ファイル形式またはファイル拡...
-
FTPでputすると空ファイルが出...
-
SWTとSwingの違い
-
標準的な、vb6.0の開始・保存・...
-
C言語での採番について
-
Acccess レポートをグループ別...
-
フルパスから最後のディレクト...
-
java ファイル出力 Cドライブ直下
-
ドラッグアンドドロップでファ...
-
jarファイルとjava.exeの関連付...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
バッファとは何ですか
-
Microsoft VBAで2GBを超えるフ...
-
VBA バイナリ―から文字列にす...
-
エラー:ストリームの終わりを...
-
EOF
-
EXCEL VBAでテキストファイルの...
-
C言語の質問です。バイナリ形...
-
MacからWinにファイルを添付す...
-
エクセルVBA 2千万行のCSVファ...
-
Javaでのエンディアン変換
-
入力ファイルをバイナリにする利点
-
テキストデータをSQLServerに取...
-
【MFC】CFileでSeekした位置か...
-
【python】Excelファイルを読み...
-
fscanf? 外部ファイル(時刻表...
-
C言語とシリアル通信の送受信...
-
ページ読み込み時に自動的にsub...
-
【Teraterm】filewritelnについて
-
C言語でBMPファイルの内容を表...
-
コンピュータ系にはめっぽう弱...
おすすめ情報