なぜMySQLを使うのか。

Question

先日、MySQLの入門書を図書館で見つけて借りてきてみました。
勉強するにあたって、まず、MySQLがなんなのかを調べてみると
データベース管理システムとあり、入力された情報などを管理するシステムだとありました。
しかし、どうしてそうしたものが必要になったのかが分かりません。
情報を管理するのであれば、普通にテキストファイルに書き出して、
その場所を明記しておけばいいと思えますし、
情報を取り出したり探したりするのであれば、該当ファイルにgrepなどをかければすむように思えます。
MySQLなどのデータベース管理システムがどうして開発され、使われ続けるのか、
どういった利点があるのか、わかりやすく教えてください。

mitoneko · Accepted Answer

簡単にまとめちゃえば、大量のデータを効率よく簡単に統一した形で情報にアクセスできるようにするための基盤です。

利点を思いつく端から並べてみましょう。
　ある条件を満たすデータを取り出すだけなら、grep一発ですね。正規表現も使えますから結構なところまである程度簡単にできます。この手で、集計をする・・・例えば、フィールドの合計を計算するとなると出来ますが、かなり上級になってきます。ある一定の条件を満たすレコードのフィールドの合計となったら、コマンドラインを読むだけでもかなり難しくなってきます。あるフィールドの値でグループ分けをして、そのグループ毎の合計となったら、そろそろ音を上げたくなりますね。
　ＳＱＬなら、この程度までならまだ初級の問題です。

データの更新が絡むと、テキストファイルの欠点が見えてきます。真ん中のデータのあるフィールドだけ修正する必要が出来ると、普通にやれば、全部のデータを読み出して該当のデータだけを修正した形で、もう一度全部書き戻す必要があります。いくらコンピュータの性能が上がったとは言え、大変な不効率です。データが１００万レコードで構成されていたら・・・更新が１秒に１件程度発生したら・・・こんな不効率な事をやっていたら、コンピュータの性能にいくらお金をつぎ込んでも足りません（笑）
　かくして、いろいろなファイル形式とアルゴリズムが開発されてきました。いわゆるバイナリファイルですが、確かに、ある一つの仕事をするためなら、とても効率よく出来るようになりました。その反面、ファイルの汎用性はなくなりました。バイナリファイルにgrepをかけるわけにはいきませんからね。
　いかに効率よく「かつ」データの汎用性を確立するか。それを両立させるために考えられたのが、データベース管理システムです。ファイルの物理格納形式からデータのアクセス方法を隔離してしまえば良い。ファイルの物理格納形式は全部データベース管理システム（ＤＢＭＳ）が面倒を見る。ユーザーは決められた形でＤＢＭＳに対してデータへの操作・検索を要求する。これで、汎用性は維持しながら、効率も追求することが出来ます。汎用性を最大限に維持するために、例えばリレーショナルデータベースでは、データの操作のためにＳＱＬという言語が開発され、この言語に関してはある程度までの規格が存在します。（実際には、方言があるので完全に統一するには至っていません。）

さて、目先を変えます。例えば、学校で、学生の住所録があります。成績表もあります。各々別の人が作成保守しているので、別々のテキストファイルです。
　住所と成績を同時に記載するレポートを要求されたらどうするかが問題です。両方のファイルをつきあわせて、同じ人のレコードを一つにまとめ上げる必要があるわけですが・・・結構な量のコードを書く必要があります。
　しかも、データ量が大きくなると、よほどの工夫をテキストファイルに仕込んでおかないと遅くて使い物にならなくなります。
　これが、簡単なコードで、しかも効率よく出来るのも、データの物理形式を、データを操作する側から分離した事によって得られる利点の一つです。ＳＱＬでやれば、簡単なコードで終わります。データの設計が正しければ、効率もとても良くできます。

最後の例として、平行性の問題を指摘しておきましょう。１００人の人が更新・検索を行うデータがあるとしましょう。テキストファイルでやろうとすると、１００人の人が全員別々のレコードしか扱っていなかったとしても、一人ずつ順番にやる必要があります。誰かがファイルを開いたら、他の人はそのファイルを開くことは出来ません。
　ＤＢＭＳを利用すると、このような管理は全て、ＤＢＭＳに任せることが出来ます。ＤＢＭＳは大概の場合において、使っているレコードだけをロックしますから、全員が違うレコードを扱っているなら、同時並行で作業が可能です。

こんな書き方をしていると、まだまだいろいろとありますが、とりあえず、ぱっと思いつくことからいくつかあげてみました。

Siegrune · Answer

例えば、

伝票番号 101 日付5/1 商品コード 111 商品名 A111 数量 3 金額 330 備考
伝票番号 102 日付5/1 商品コード 101 商品名 A101 数量 2 金額 330 備考
伝票番号 103 日付5/1 商品コード 105 商品名 A105 数量 1 金額 101 備考
伝票番号 104 日付5/1 商品コード 111 商品名 A177 数量 2 金額   0 備考 伝票番号 101 の代替品
伝票番号 105 日付5/1 商品コード 111 商品名 A111 数量 2 金額 220 備考

というデータを考えて、伝票番号101の内容を知りたいときに、
grepで「101」を探すと全部出てきてしまいます。
「伝票番号 101 」で探しても、101と104で出てきてしまいます。
さて、困った困ったということで、データベースソフトでは、
伝票番号が101のデータを出力せよと命令できます。
そうすると、1行目だけしかでてきません。

というのが最も必要な理由です。

nora1962 · Answer

まずはパフォーマンス的な問題です。数十万件～数百万件のデータになった時単独のテキストファイルでは巨大になり、これを複数のユーザーがgrepで検索することは実質的に困難です。
MYSQLなどのRDBMSなら、検索項目に対してインデックスを作成することで高速な検索が可能です。
データの更新・削除については単純なテキストファイルでは、ファイル全体の読み込みと書込になるのでより困難です。

もう一つは、アプリケーションがデータに対して同時実行する際の整合性の担保です。
商品データ、売り先データ、仕入れデータ、売上データなどがあった時に複数のアプリケーションがアクセスした場合、単純なテキストファイルでは整合性を保証できません。やろうとするとファイル全体をロックする必要が出て、同時実行できる処理件数が極めて少なくなってしまいます。
これをトランザクション処理と呼んでます。

cisim_body · Answer

私がデータベースシステムに最も魅力を感じるのは、

１．データベースに同時アクセス出来ること
２．リレーションシップを組むことが出きること

の２点でしょうか。

１．同時アクセス
厳密には、１つのデータベースの１つのレコードには同時アクセスできませんが、別レコードには同時アクセスできます。
残念ながら、テキストベースのデータベースとgrep、sed、sort、tail、head、・・・などでは、同時アクセスするとデータベースの整合性が失われる恐れがあります。
＊＊例＊＊
ユーザＡがソートをかけているときに、ユーザＢがデータを書き換えたときの動作はどうなるのでしょうか？

２．リレーションシップ
第３正規化を行った場合のデータベースの関係をテキストデータベースだと実現しにくいと思います。
例は、複雑になりすぎるので、ギブアップです。
「第３正規化」でググッてみてください。
テキストデータ＋ＵＮＩＸテキストツール　だけだと厳しいと解ってもらえると思います。
さすがに、awkやperlを使えば何でもアリでしょうが・・・。

e3tatsu · Answer

DBMSの存在理由はオペレーティングシステムの存在理由と同じです．
オペレーティングシステムの役割を思い出してみてください．

なぜMySQLを使うのか。

簡単にまとめちゃえば、大量のデータを効率よく簡単に統一した形で情報にアクセスできるようにするための基盤です。

例えば、

まずはパフォーマンス的な問題です。

私がデータベースシステムに最も魅力を感じるのは、

DBMSの存在理由はオペレーティングシステムの存在理由と同じです．

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

　簡単にまとめちゃえば、大量のデータを効率よく簡単に統一した形で情報にアクセスできるようにするための基盤です。