あるサイトのPV数、申込数の分析を行うにあたって確率モデルの適用を考えています。
各ページのPV数・アクション数の確率的な分布の導き方について
以下の考え方で問題ないかご意見いただきたいです。
※当方、15年ぶりに学生時代の統計の教科書を引っ張り出して悪戦苦闘中です。
-------------------------------
総ページ数:a
申込可能なページ数:b ※考慮外ですが、データとして持っています
UU数:c
総PV数:d ※個別ページ毎のPV数の情報も持っています
総申込数:e ※同上
と置いたとき
ユーザ1人当たりのPV数平均=d/c
ユーザ1人当たりの申込数平均=e/c
【仮定】ユーザの申込行動:申込可能なページを参照した際に一定の確率pで申込を行うベルヌーイ分布に従う
# 実際には一定の確率ではないので、ここも分析対象になるかと思いますが、
# それはまた別の機会に。
▼
http://ja.wikipedia.org/wiki/%E8%B2%A0%E3%81%AE% …
の記法に倣って
サイト閲覧を終了するまでの申込件数r=e/cと置いたときユーザ1人当たりのPV数の分布は負の二項分布に従う
このとき、PV数の期待値E(X)=d/c=e/cp ∴p=e/d
※この確率分布関数をf(x)と記述します。
-------------------------------
このとき、個別ページのPV数の確率分布モデルを適用するにあたり、
ユーザがページ選択する確率:1/a
この試行を全体でd回繰り返すことになるので、なので予想されるPV数の分布は
f(x)*d/aとなる
アクション数も同様の導き方を考えています。
A 回答 (1件)
- 最新から表示
- 回答順に表示
No.1
- 回答日時:
何をしたいのかよく理解できたわけでないですが。
ページビューはページによって大きな差があり、人による好みの違いも大きいことから、一律にaで割り算する「ユーザがページ選択する確率:1/a」「PV数の分布はf(x)*d/aとなる」の部分は、無理があるような気がします。
そもそも、ページビューを既定する要因は様々あると考えられ、その大部分は未知の可能性があることから、演繹的にモデルを導くのは難しいのではないでしょうか。
PV数の確率分布をモデル化したいなら、実際のPV数の分布をグラフ化してみて、似た形状の確率分布にあてはめる方法があります。案外、正規分布やポアソン分布で事足りる場合があります。
お考えのf(x)*d/aも含めて、複数の候補のどれを選ぶかということなら、それぞれを最尤法であてはめてみて、尤度が最も大きいモデル(あるいはAICが最小のモデル)を選べば良いと思います。
選ばれたモデルについて、どうしてそういう関数形になったのかが気になるならば、後付で理屈を考えればよろしいかと。
回答ありがとうございます。
現在の分布形状を見ると、対数正規Orべき乗っぽい形状になっているので、
うまくロジックとして説明できそうな上記モデルをベースとして
母集団分布を仮置きしたい、というのが意図するところになります。
この後、各ページで持っている属性をパラメータとして、ページ側の属性だけで
何らかの傾向を見出して行きたいと思っています。
正規分布・ポアソン分布は分散が大きいのでちょっと当てはめるのが難しいです。
(対数正規だと中間だといい感じにQQプロットは乗るんですが、両方の裾で
外れてしまい、検定も通らないのです…)
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
標準偏差の1.5SD
-
エクセルのNORMSINV関数の意味...
-
確率・統計の問題について教え...
-
なぜ正規分布の標準偏差は約6...
-
ある大学の男子学生 1,000 人の...
-
5%で当たりが出るガチャをn回引...
-
±4σについて
-
確率・統計学の問題です
-
正規分布の反対は?
-
標準偏差から寿命を計算する
-
±4σに入る確率について教えてく...
-
4人がじゃんけんしてあいこにな...
-
赤玉6個、白玉4個の入った袋か...
-
白玉1個、赤玉2個が入っている...
-
赤玉5個と白玉7個入った袋から...
-
8頭身あって10人に1人くらいの...
-
数学Aについてです! 袋の中に...
-
白玉4個と赤玉2個が入っている...
-
大中小のサイコロの積が6の倍数...
-
4桁の暗証番号について。 わか...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
おすすめ情報