会社の10-12月支店別企画達成率と対前期売上伸び率の回帰分析を実施し、
・回帰係数0.63
・切片:-0.5
・p値:0.01
にて関係性ありとの結果が出ました
検証のため、上記係数に各支店1-3月企画達成率xを代入して売上伸び率予測値を算出し、実際の売上伸び率と対応のあるt検定を実施しました
結果、平均が
・予測値:11%
・実測値:4%
と大きくぶれ、
・p値:1.33E-05
と思いっきり有意差ありになってしまいました
商品はいずれも同一品目単品で目標値も同一であり、特段大きな±イベントもなく、外挿もほぼありません
回帰分析にて関係性ありとの結果が出た場合、時期が違っても大きな±イベントがなければ、係数を当てはめればある程度数値予測できるのが回帰分析ではないのでしょうか?
分析結果が良くても今後に活用できなければただの数字遊びになってしまい実務運用できないのですが、やり方もしくは考え方が間違っているのでしょうか?
もしかしたら情報が足りないかもしれませんがわかる方がいらっしゃればご教授お願い致します
No.4ベストアンサー
- 回答日時:
No.1です。
・n=10
と少ないのは仕方がないとしても、1月-3月の結果が良くありませんね。
季節変動はとりあえずおいておくとしても、企画達成率だけでは難しそうです。
10月-12月と1月-3月を1つの散布図にまとめたときに、支店毎に何らかの傾向がつかめないでしょうか?
10月-12月の回帰直線に近い支店、離れた支店があれば、地域による違いがあるのかもしれません。
あるいは、同じ回帰直線で説明できそう企画達成率の範囲があれば、その範囲だけに絞るとか。
(少ないデータ数がさらに少なくなりますが)
合算するとr=0.66、p=0.002へとn=20になったこともあり、数値が格段に良くなりました
地域での傾向は見られず、ほぼ全支店1-3は10-12に比べて低下し、10-12と1-3が2つのクラスターになっています
因みに外れ値らしき1つを抜き、n=19にて再検証するとr=0.71、p=0.0006になりました
企画の有用性は再認識できましたが、回帰係数から予測値を算出しての実測値との比較検証はやらない方がいいことはわかりました
何度もご教授頂きありがとうございました
No.5
- 回答日時:
#2です。
コメントありがとうございます。比の値の回帰については初歩的な問題なのです。
2割増しの4割増しは6割増し、なんて足し算はしませんよね。
それと同じで、回帰分析を行うとき、縦軸横軸の数値は加法性が無ければなりません。
なぜなら、回帰線は横軸の平均と縦軸の平均を通りますが、その平均を計算する際に計算機の内部で足し算をしているからです。
つまり、各支店をサンプルとして回帰したときに、回帰線は全社平均を通るはずなのですが、そうなっていますか。
達成率という数値は足して平均を取れば良いものではありませんから、そうなっていないはずです。
比の値は、回帰の問題では弾力性と言い、何割とか何倍という値で、それには加法性がありません。このようなケースは普通の回帰分析はできません。
一番簡単なのは、対数加法性といって、縦軸も横軸も比の値なら、両方とも対数を取って計算してやればよいです。
まあまあ、良い近似になります。
10-12、1-3共、全社平均は回帰直線上にほぼプロットされていました
横軸が達成率、縦軸が伸び率の率同士のため、うまくいっているのだと思います
片方が金額の時は注意します
対数加法性のこともまた調べてみます
ありがとうございました
No.3
- 回答日時:
#2です。
>回帰分析にて関係性ありとの結果が出た
とは、p値が有意となっていることだと思いますが・・・、
この検定の帰無仮説は、H0:β=0ですから、「計算された傾きβは偶然ではない」というだけで、横軸縦軸の因果関係があったと言っているわけではないです。
No.2
- 回答日時:
そもそも、〇〇率のような比率は、単純な回帰をやってはダメですが、何か工夫はされましたか。
ロジット変換を行うとか、一般化線形モデルを使ったとか。
また、達成率は良いとして、伸び率は二つの売り上げ値から1つの数値を出しているので、サンプル数が減っているのでは?
均した値を使えば、フィットして当たり前ですが、最初の解析がそうなっていませんか。
ご返信ありがとうございました
詳細分析結果は下記の通りです
・n=10
・r=0.77(10-12)、0.18(1-3)
・回帰係数 y=0.63x -0.5(10-12)、y=0.19x -0.14(1-3)
・p=0.01(10-3)、0.63(1-3)
となり、1-3月だけ見れば売上伸び率との関連なしです
私のレベルは統計検定3級はなんとか取得し、2級は難易度が上がったこともあり、何度受験しても合格できないレベルです
解析もエクセル搭載分析ツールで行っており、今回の分析はエクセルツールでの単純な回帰分析やt検定です
複雑な分析は全くできません
ロジット変換や一般化線形モデルとはそもそも意味が分かりません
ロジット変換は取り敢えず「企画達成率」をエクセルの公式を当てはめて変換しましたが「売上伸び率」は0から1の間の数値を変換するとあるのでそのままにしており、そのあと何をすればいいのかわかりません
一般化線形モデルはウィキペディアで検索しましたが公式からして全く意味不明でとても活用できそうにありません
伸び率は2つの数字を使うので良くないとのことですが、売上額を使うと大都市支店の数字が大きくなってしまうため活用できません
10-12月p値=0.01は100回の解析で99回は同様の結果になり再現性が高いと理解してるのですが、常に様々な環境変化の中では統計解析は将来指標にはならないのでしょうか?
また外勤がメイン業務のためそれほど多くの時間を割くことはできないのですが、多少の精度は犠牲にして短時間にて分析する方法はないのでしょうか?
また2つ目のご返信の「計算された傾きβは偶然ではない」とは売上予測値と実測値を比較した対応のあるt検定にてp=1.33E-05ということは「両者の平均値の違いは偶然ではない」ということなので「10-12月回帰係数を基に将来予測をすることはできない可能性がある」とのことではないのでしょうか?
No.1
- 回答日時:
支店数と相関係数は記載した方がよろしいかと思います。
売り上げの伸び率は、企画達成率だけで十分説明できているのでしょうか。
例えば、季節の違いは考慮しなくて大丈夫?
それと1月-3月について、10月-12月と同様に回帰分析すると同じような結果が得られているのでしょうか?
早々のご返信ありがとうございました
・n=10
・r=0.77(10-12)、0.18(1-3)
・回帰係数 y=0.63x -0.5(10-12)、y=0.19x -0.14(1-3)
・p=0.01(10-3)、0.63(1-3)
となり、1-3月だけ見れば売上伸び率との関連なしです
n=10は少ないのは理解していますが、下の階層の事業所単位にすると企画達成率の集計ができません
企画達成率だけでは説明不十分なところももちろんありますが、そもそも「企画注力は無駄ではない」との検証資料として活用しており、「納得できないと行動できない」人達からもある程度の納得感は得られています
季節変動による影響ももちろん理解していますが、目標値は対前同月をベースにしており、また昨年10-12月結果を今年10-12月に活用するにしても1年経てば社内外の環境要因も大きく変わり、また折角のデータを1年後まで温存していてはその間9カ月が無駄になります
10-12月p値=0.01は100回の解析で99回は同様の結果になると理解してるのですが、常に様々な環境変化の中では統計解析は将来指標にはならないのでしょうか?
もっと高度な分析をすれば高い精度の分析ができるかもしれませんが、外勤がメイン業務のためそれほど多くの時間を割くことはできません
ある程度の精度は犠牲にして、そこそこ納得感のある分析はできないのでしょうか
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
- ・ゆるやかでぃべーと タイムマシンを破壊すべきか。
- ・「I love you」 をかっこよく翻訳してみてください
- ・歩いた自慢大会
- ・許せない心理テスト
- ・字面がカッコいい英単語
- ・昔のあなたへのアドバイス
- ・かっこよく答えてください!!
- ・あなたが好きな本屋さんを教えてください
- ・これ何て呼びますか Part2
- ・人生で一番思い出に残ってる靴
- ・ゆるやかでぃべーと すべての高校生はアルバイトをするべきだ。
- ・初めて自分の家と他人の家が違う、と意識した時
- ・単二電池
- ・チョコミントアイス
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
理科のグラフで、直線と曲線の...
-
(統計学)有意傾向がある場合...
-
aを実数の定数とする。二次関数...
-
極値をもつ時と持たない時、単...
-
心理学の統計について
-
五段階評価での有意差の求め方...
-
統計学の問題でわからないので...
-
標準正規分布表の確率で、上位...
-
統計で、信頼区間のマイナス値...
-
統計学のサンプル数2000の根拠は?
-
EXCELにてローパスフィルタを作...
-
2郡の共通の標準偏差とは
-
卒業論文のアンケートの数について
-
エクセル統計のランク化した数...
-
青い下線部分はなぜそうなるの...
-
少ない標本数、4段階評価での...
-
騒音値の「90%レンジの上端」...
-
数3の複素数です 12分の25πが12...
-
t検定を繰り返してはいけない理...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
カイ二乗検定
-
エクセルのグラフから半値幅を...
-
統計について
-
検量線の決定係数について
-
3群の比較にχ二乗検定を使う場...
-
【統計】有意に「高い」?「低...
-
エクセルの統計でχ二乗検定の結...
-
ノンパラメトリック検定の多重...
-
パーセンテージの平均値2標本の...
-
パイロットサンプルって何ですか?
-
二次関数の問題です 二次関数 y...
-
理科のグラフで、直線と曲線の...
-
心理機能診断をしたのですが、...
-
アンケートの集計分析の基礎(...
-
変化率のみで、有意差の検定は...
-
検定統計量の値がマイナス
-
極値をもつ時と持たない時、単...
-
最小二乗法を反比例の式を元に...
おすすめ情報