とっておきの手土産を教えて

大学のゼミのレポートがムカつきます。


R言語というデータ分析に特化したプログラム言語を用いた授業の課題のお話です。
(マイナーなのでプログラムの授業だと認識して頂いた方が理解がしやすいと思います。)

授業(ゼミ)で扱うデータは、生徒がスムーズに分析できるように先生が予めデータに手を加え、整理されています。

なので、授業ではスムーズに授業が進行されます。

問題はここからで、レポート課題が出される度に「何かしらのデータを○○を用いて分析せよ。」といった形式で出題されます。

この"何かしら"というのが本当に厄介で、手法に合うオープンデータを見つけるのに何十時間もかかります。

授業では特定の手法を使った分析ができるようなデータになっているので授業はスムーズに進行しますが、オープンデータから特定の手法を使った分析ができるような都合のよいデータがなかなか見つかりません。

良さげなデータを見つけても、その特定の手法はできなかったり、データの情報が不十分だったりします。

何を言っているの伝わる気がしませんが、とにかく、限定的な分析手法ができるようなデータを見つけるのが難しすぎます。



※以下は専門的なことなので読まなくて結構です。

もっと詳しく書きますと、RFM分析をオープンデータを使って分析しろと言ってくるのです。

RFM分析は「顧客の最新性・顧客の頻度・顧客の金額」と授業で習いました。

このような項目のあるオープンデータは僕のような機械音痴では見つけるのは難しく、見つけたと思ってもどれかが抜けていたりします。

分析手法を指定するなら分析するデータも用意しとけと思います。

なぜ、自分でオープンデータからRFM分析できるデータを探さないといけないのでしょうか。
時間がかかって仕方ありません。

ムカつきます。オープンデータにそんなに質の良いものはない。都合のいいデータはないとわからないですか?

A 回答 (1件)

愚痴(笑)?



でもまぁ言ってるこたぁ分かる。
別に統計分析に限った話じゃなくって、プログラミング自体が「データが無ければ成立せん」って性質が濃いからね。
このサイトでも「プログラミングが上手く出来ません」と言う質問投稿が多いんだけど、特定のデータを使ってたりして「それがない」と何とも答えようがない、ってのが多い。
データを軽視する人ってのがどのみち結構多いんだ。

んで、RFM分析?
調べた限りで言うと、そもそも「企業が自社製品を売った際の顧客データ」を分析する手法じゃん。
そんなの「企業の重要なデータ」なんでオープンにするわけねぇだろ、とか思うんだけどな(笑)。顧客の超重要データじゃん。
確かに貴方の言う通り、「何考えてんだ」って話になる。

んでだな。
Rって色々とパッケージが提供されてんだけど、パッケージに「テスト用付属データ」ってのが付いてる可能性が高いんだよね。
んで、その名もrfmってパッケージが存在する。
Rを起動した後、R上で、

install.packages("rfm", dependencies = TRUE)

と打てば、パッケージのダウンロード/インストールが始まる。
(実は相当時間がかかるんで覚悟しておくように)


んで、そのrfmパッケージには

・RFM - Customer Level Data
・RFM Transaction Data

って2つのサンプルデータが入ってんだよ。
その先生、いい加減なんで、「データは何でも良い」んだったらこれら使えばエエんちゃうかいな。
両者ともR上で、

library("rfm")

した後、前者は

rfm_data_customer

後者は

rfm_data_orders

とすれば見れるしアクセスできっから。
「大学のゼミのレポートがムカつきます。 R」の回答画像2
    • good
    • 3
この回答へのお礼

天才やな

ご回答ありがとうございます!!
これは有益な情報ですね!是非活用させていただきます。(データさえあればなんとかできます。)
そんなパッケージがあるなんて盲点ですね...!!
こんな短時間で質の高い回答が頂けるなんて感動です笑

やっとの思いでつけた購買履歴データのオープンデータは不完全なものばかりで気が滅入ります...。
でも、これでできる気がしてきました。早速挑戦してみようと思います。
ご回答ありがとうございました!
まだベストアンサーは選べないようなので選べるようになったら選ばさせて頂きます!!

お礼日時:2023/06/29 04:46

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


おすすめ情報