DBMとテキストファイルのどちらが良いと思われますか？

Question

こんにちは、 windows + ActivePerl の環境で、簡単なデータを記録して後から検索、修正、削除したいのですが、データを格納するのに、テキストファイルにするか、DBMを使用するか悩んでいます。テキストファイルに、(行番号,"*" x 100)のレコードを10万行出力したら、約10MBで、 DBMファイルに　(行番号=>"*" x 100)のハッシュを出力したpagファイルは510MBでした。その後、99999番目のレコードを以下のスクリプトで表示したところ、体感的には違いがありませんでした。（どちらも一瞬で終了します） ******************************* #テキストファイル　検索 my $id = 99999; my $data; open(FILE,"){ if($line =~ /$id/){ $data = $line; last; } close FILE; print $data; ******************************* #DBMファイル　検索 my %DBM = (); my $id = 99999; my $data; dbmopen(%DBM,"DBMfile",0666) or die; if (defined $DBM{$id}){ $data = $DBM{$id}; } dbmclose %DBM; print $data; DBMを使用した場合、すべてのデータをメモリ上に展開するのでしょうか？もしそうなら、510MBも消費されてはたまりませんので、テキストファイルになりますが、コーディング等はDBMの方が楽かな？と考えています。データベースを利用できない環境の場合、どちらが良いのでしょうか？ご意見お願いします。

guci-ok · Accepted Answer

今晩は。

この話題では、様々な論点があるので、狭い紙面では難しいこともありますが、
幾つか書かせてもらおうと思います。

まず、dbmopenと書いてありますが、これは少し古い書き方だと思います。
最近の書籍などでは別の書き方をしていると思いますので当たってみて下さい。

次に10MBくらいでは、余り時間はかからないかもしれませんが、もう少しサイズ
が大きくなるといくらか時間がかかるようになります。
テキストファイルではseek関数によってポインターを何処にでも移動できますから、
たとえば固定長のレコードの場合は、レコード長ｘレコード番号までseekすること
によって即座に目的のレコードを読むことができます。

DBMを使うのは、キー(文字列)でダイレクトにレコードを操作できるからです。
しかし、たとえばSDBMの場合、１レコードの長さに制限があったりするので注意
が必要です。(2KBとか4KBが最大)
また、普通のDBMはキーと値(=文字列)のペアでしかなく、単純なデータしか
扱うことができません。
MLDBM(Multi Level DMB)は、これを改善したものですが、やはりデータ長の制限が
あります。

私がお勧めするのは、DBM::Deepです。

これは100%Perlで書かれたDBMで、Perlの配列やハッシュなどの変数を「そのまま」
保存することができ、データのサイズに制限がありません。パフォーマンスも
かなり良いと思います。
少し前に調べていたことなので、
最新のバージョンは知りませんが、完成度はかなり高いと思います。
私なら、DBMの類を使うならDBM::Deepを使います。ソースコードを見てみれば、
とても丁寧にきちんと書かれているのが分かります。作者とはメールでしか
やり取りしたことはありませんが、とても好印象でした。

onosuke · Answer

ア.DBMを使用した場合のメモリ使用量について
Perl標準添付のSDBM実装だと、ファイルデータの保持目的では、ブロックバッファ分のメモリ(数kバイト)しか消費しません。

>99999番目のレコードを以下のスクリプトで表示したところ
このテストでは、人間の時間感覚で計時する限り、有意な差は得られないでしょうね。(CPUクロック数の単位精度でやらないと…)
また、OSのバッファメモリに必要なデータが全て収まっていて、テキストとDBMのファイルサイズ差も問題にならないでしょう。

イ.データベースを利用できない環境の場合、どちらが良いのか？
「DBMもデータベースですが…」というツッコミはさておき、
サイジングを気にするのであれば、もっと他のDBM系実装についても比較検討すべきです。

参考URLにQDBMのページを掲示します。
「兄弟」というセクションに他のDBM系実装と、ベンチマーク結果が掲載されています。

参考URL：http://qdbm.sourceforge.net/

DBMとテキストファイルのどちらが良いと思われますか？

今晩は。

ア.DBMを使用した場合のメモリ使用量について

この回答への補足

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング