プロが教える店舗&オフィスのセキュリティ対策術

ハッシュの計算にかかる時間はファイル数とファイルの総容量のどちらに左右されるのでしょうか

A 回答 (2件)

#1と同様の意見です。


自作のプログラム(ハッシュを計算して重複排除する)でやってみたところの数値です。

PC環境:Vista x64、Q9450、8GB、RR2310のRAID5、シーケンシャルアクセスは200MB/S程度

大きなファイルの場合:
 約80MB/S~100MB/Sでハッシュ値を求めることが出来ました(1Tです)。
小さなファイルの場合:
 約30万件のファイルがログ出力しながら約2時間で処理されます。

ディスク性能とファイルサイズに依存するようです。
    • good
    • 0

ハッシュ値はファイルの全バイトに依存するので、ファイル全体を一度は読み込む必要がある。


従ってファイルサイズに依存する。通常はサイズに対して線形オーダーの時間がかかる。
全体サイズが同じでファイル数が増えた場合、ハッシュ計算の呼び出し回数や扱うハッシュ値の数が増えるので、そのオーバーヘッド分は処理時間が増えるだろう。しかしハッシュ計算に掛かる正味の時間は変わらないと考えられる。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!