システムメンテナンスのお知らせ

プログラミングで図鑑を作る方法は何ですか?

gooドクター

A 回答 (4件)

企業で統計を推進する立場の者です。



図鑑っていう表現は面白いですね。まあ単純に言えば、○○目△△科××族とかいう動物園で見かける分類になりますかね。図鑑は調べたい動物や植物がすぐ見つかることが重要です。
我々はGoogle検索とかしますが、一瞬で見つけ出してきます。ある意味、優れた図鑑ですよね。

プログラミングでやることは、種々のデータが流れ込む「レイク(湖)」と呼ばれるデータベースから、データを汲み取って、フォーマットと呼ばれる条件に従ってデータを整列させ「マート(店)」と呼ばれるデータベースに格納することです。動植物学的に言えば図鑑ですが、普通は商品陳列棚に整然と並べてあるスーパーマーケットみたいな感じから「マート」と呼ばれます。

ツィートなどのようにダラダラ垂れ流し状態のデータから目的のものを汲み取るプログラミングが「スクレイピング」です。スクレーパーというのはヘラですから、掻き取るというのが正しいかも。本もたくさん出ています。
格納するプログラミングは、すぐ取り出せることが重要ですので、見出しをどうやって付けるかが重要です。いくつかの方法がありますが、一例はN-gramです。参考書を探すときは「全文検索」とか「高速文字符号化技術」というのがキーワードになります。

ちなみに私は60代のオヤジです。すみません。
    • good
    • 0

HTML

    • good
    • 0

意味不明

    • good
    • 0

Wikiを作るってイメージですか?

    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

gooドクター

このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング