社員IDが1から10まであって、その他のフィールドは名前、住所、電話番号など書いてあるとします。10人分のデータの中から名前が近藤さんを探しなさいといった時、すぐに検索結果は返ってくると思います。
仮に社員が100万人いて検索結果を得ようとしたらかなりの時間がかかると思います。数10人なら自力でデータを用意できるのですが、100万とかいう数になると自力では無理があります。そこでデータベース側でランダムにデータをつくるということは可能なんでしょうか?もしくはプログラムの方でなんらかの制御をしてデータを100万件データベースにいれていくというような処理しかないんでしょうか?
やりたいことは検索時間が10件と100万件だとどのくらい違うだろうということをやりたいと思っております。よろしくお願いします!!
No.4ベストアンサー
- 回答日時:
たとえばこんなやり方・・・
CREATE TABLE `a` (`id` INT NOT NULL AUTO_INCREMENT PRIMARY KEY ,`data` VARCHAR( 20 ) NOT NULL);
CREATE TABLE `b` (`id` INT NOT NULL AUTO_INCREMENT PRIMARY KEY ,`data` VARCHAR( 20 ) NOT NULL);
idとdataというフィールドをもった二つのテーブルを作ります。
INSERT INTO `a` SET `id`=NULL;
データを一つ作ります。
INSERT INTO `b` SELECT NULL,'' FROM `a`;
INSERT INTO `a` SELECT NULL,'' FROM `b`;
という2行のSQLを処理を20回繰り返します。
これで100万件のデータができます。
(テーブルbはもういらないので消してよいです)
さらに
UPDATE `a` SET `data`=MD5(RAND());
とすればdataにランダムな文字列がセットされます
No.3
- 回答日時:
わたしは、約15万人のデータベース(26項目)を自作してします。
エクセル約50MBを4シート×4文書に分けているので、100万
人なら約330MB、25文書あれば収容できます。
>検索時間が10件と100万件だとどのくらい違う<
検索のための準備作業は変らず、読込み時間が違うだけです。
USBにまとめて一括検索すれば、数分で抽出できるでしょう。
さらに、あらかじめソートされていれば、全データ必要ありません。
エクセルよりアクセスの方が大量処理できるのですが、部分的な抽出
については、むしろエクセルのほうが扱いやすいのではないでしょうか。
No.2
- 回答日時:
#1です。
誤字がありました。
「ユーザ側で利用した」
↓
「ユーザ側で用意した」
ついでに、B-TREEインデクスについて、簡単に触れておきます。RDBMSにより、多少の違いがありますが、考え方は似たようなものです。
主なRDBMSでは、行やインデクスの情報を、ページといった単位で管理しています。ページはI/Oの最小単位なので、ブロックと考えていいでしょう。
この1ページで、何件のインデクスキー値を管理できるかは、
管理可能なキー数=(ページ長-ページの制御情報)/(キー長+行の格納アドレス)
といった計算式になります。
ページ長=4096バイト、ページ内の制御情報=96バイト、キー長=10バイト、行の格納アドレス=6バイトとすると、250個のキー値が管理可能です。
インデクスの分割を配慮して、125個のキー/ページとすると、
100万件を管理する最下位ページ数は、1000000/125=8000ページ。
2段目は、8000/125=16ページ、
最上位が1ページ
で、インデクスは3段になります。
100万件の中から=条件で1件の検索なら、データ部のI/Oが1回、インデクスのI/Oが3回になります。
No.1
- 回答日時:
RDBMSは、何でしょうか?
ユーザ側で利用した多量データを格納する場合、RDBMS側で用意しているローダ(通常のINSERTの処理でなく、ログを吐き出さなかったり、インデクス更新を後で一括で行ったりすることで、性能向上させている)を使う場合が多いです。
テスト用に100万件程度のデータを作るなら、何らかのプログラミング言語でツールを作ってもいいし、ストアドプロシジャを実装しているRDBMSなら、ストアドプロシジャで容易に作れます。
>検索時間が10件と100万件だとどのくらい違うだろうということをやりたい
数万件といった母体データから数件を検索するなら、一般的にインデクスを付けます。B-TREE構造が一般的に知られており、母体件数に対して、対数の関係になるので、データ量が増えても、極端に性能劣化することはありません。
http://biz.rivus.jp/words/btree_index.html
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・一回も披露したことのない豆知識
- ・これ何て呼びますか
- ・チョコミントアイス
- ・初めて自分の家と他人の家が違う、と意識した時
- ・「これはヤバかったな」という遅刻エピソード
- ・これ何て呼びますか Part2
- ・許せない心理テスト
- ・この人頭いいなと思ったエピソード
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・あなたの習慣について教えてください!!
- ・ハマっている「お菓子」を教えて!
- ・高校三年生の合唱祭で何を歌いましたか?
- ・【大喜利】【投稿~11/1】 存在しそうで存在しないモノマネ芸人の名前を教えてください
- ・好きなおでんの具材ドラフト会議しましょう
- ・餃子を食べるとき、何をつけますか?
- ・あなたの「必」の書き順を教えてください
- ・ギリギリ行けるお一人様のライン
- ・10代と話して驚いたこと
- ・家の中でのこだわりスペースはどこですか?
- ・つい集めてしまうものはなんですか?
- ・自分のセンスや笑いの好みに影響を受けた作品を教えて
- ・【お題】引っかけ問題(締め切り10月27日(日)23時)
- ・大人になっても苦手な食べ物、ありますか?
- ・14歳の自分に衝撃の事実を告げてください
- ・架空の映画のネタバレレビュー
- ・「お昼の放送」の思い出
- ・昨日見た夢を教えて下さい
- ・ちょっと先の未来クイズ第4問
- ・【大喜利】【投稿~10/21(月)】買ったばかりの自転車を分解してひと言
- ・メモのコツを教えてください!
- ・CDの保有枚数を教えてください
- ・ホテルを選ぶとき、これだけは譲れない条件TOP3は?
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・【コナン30周年】嘘でしょ!?と思った○○周年を教えて【ハルヒ20周年】
- ・10秒目をつむったら…
- ・人生のプチ美学を教えてください!!
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
ACCESSのデータをWebブラウザで...
-
MS-Accessのエクスポートで異常...
-
ACCESS2010 Excelエクスポート ...
-
1回目の実行に3分、2回目の実行...
-
エクセルのフィルタ抽出が固まる
-
【DB】同じトランザクション内...
-
警察はスマホに保存した動画や...
-
接続されてるユーザーを切断す...
-
バッチファイルで2つのファイル...
-
復旧中のデータベースについて
-
ログファイルの圧縮がされずに...
-
マスタメンテとは?
-
ファイルの存在チェック
-
DATファイルをEXCELで開きたい
-
SQLServer2012の復元ができない
-
DAOファイルのSQLクエリの部分...
-
ACCESS2003での150人同時利用
-
PCが悪くなって新しいPCにSSMS...
-
Accessdでの「トランザクション...
-
一つのトランザクションでSELEC...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
MS-Accessのエクスポートで異常...
-
ACCESSのデータをWebブラウザで...
-
1回目の実行に3分、2回目の実行...
-
Sqliteで使えない文字。
-
accessの上限容量2Gでは容量が...
-
ACCESS2010 Excelエクスポート ...
-
ACOSのRDBについて教え...
-
SQL ServerにExcelをリンクさせ...
-
ツリー情報のデータをSQLで取得...
-
SQLServerのDBのうちテーブルを...
-
SQL文で、重複データの上書きは...
-
過去データに対するデータベー...
-
別サーバーへのデータの同期更...
-
ACCESSのクエリからORACLEのDB...
-
会社の諸事情により全システム...
-
AccessのLANでの共有
-
一定時間で自動に2つのSQLServ...
-
VBからACCESSレポート...
-
SQLSERVERのテーブルにデータを...
-
SQLite3にて重みづけを行った抽...
おすすめ情報