サンプル選定の仕方で悩んでいます。詳しい方、教えて下さい。統計初心者ですので、表現の仕方などが間違っているかもしれません。
相関関係のあると思われる2群のサンプルについて、適切なサンプル(相関が認められる)のみを選び出したいのですが、方法は次の通りでいいのでしょうか。
(1) F検定をして、母集団の分散が等しい場合と異なっている場合に分ける。
(2) (1)の結果を基にT検定でP値を求める。
(3) (2)の結果が5%未満であるものをサンプルとして選定する。
上の方法が間違っていない事が前提ですが、(3)のP値が5%未満になると有意差があるという説明がサンプルとして選ぶべきか選ばないという事を意味しているのか確信がありません。
よろしくお願いします。
No.1ベストアンサー
- 回答日時:
>方法は次の通りでいいのでしょうか。
書かれていることが、バラバラです。
というのも、相関関係は、AとBとの関係の有無、例えば身長と体重に関係があるか否かを判断する者。散布図を描き、相関係数と回帰式を算出します。
t-検定と、F-検定は、2群(1年生と2年生など)の平均値に、有意差があるか否かを判定するものです。
>適切なサンプル(相関が認められる)のみを選び出したいのですが
これは、都合の悪いデータを棄てる、ということで、統計学ではやってはならないことです。ただし、異常と判断されるデータを棄てる棄却検定というのは認められていますが、初心者が適正にやれるとは想えません。
1) どのようにしてデータを集めたのか、
2) 平均値の差を言いたいのか、両者に関係があることを言いたいのか、目的をハッキリさせ無い限り・・・。
訳の分からない質問にご回答下さりありがとうございました。
過去のデータ(株価の動き)を基にある事項が起こった時に異常リターンが発生するか調べようとしています。過去のデータ(2集団)に相関関係にあるかを吟味し、相関関係にないと思われるサンプルデータを除きたいと思うのです。
回帰分析後、決定係数を出したのですが、どれも低くそのデータを除くのは止め、他に方法はないかと調べておりました。
T検定は相関関係を調べる手段にはならないんですね。的外れな事をやろうとしていました。
No.3
- 回答日時:
特定の銘柄について日々の株価推移を予測するのは不可能ですが、
分野別だったり過去のデータにおける変動要因の推定はある程度可能だと思います。
こんな分析に意味があるかどうかはさておき、夏季の気温上昇と飲料メーカー株・家電メーカー株などは分析するまでもなく正の相関が認められます。また、M&Aや新技術の発表を期に上昇する銘柄は腐るほどあります。その他としては金利の変動に伴う株価の上下なども国際間の金利水準の相対的変化においては意味があります。
どういう分析をしようとしているのかいまいちピンとこないので適当なことを書いていますが、個別具体の事象を分析するのは不可能に等しいので、取り組まれるのであればやはり大まかな流れにとどめるのが良いのではないでしょうか?
技術的なことに関しては詳しくないのでパスさせていただきます。
ってそれじゃ役には立ちませんね(汗
アドバイスどうもありがとうございました。
その後、Pearson検定が出来るソフト試用版を見つけ試してみました。相関関係について目安になるようです。全てを検定するのは出来ないので、怪しいものをピックアップして検定をする事にしました。
No.2
- 回答日時:
株価について、私がやった分析は、横軸に年度の一人当たりのGNP、縦軸に平均株価を取りました。
その散布図を描くと、一目でバブル期は異常に上がっている、と判断できました。この場合、バブル前の回帰式と、バブル期後の回帰式が異なることを示せば良いのですが、私にとってはどうでも良いことなので、やっていません。
>相関関係にないと思われるサンプルデータを除きたい
散布図で、回帰式から外れる点については、回帰式の上下に±2σの範囲を取り、その範囲から外れる点は、棄却するというのがあります。
2σは、正規分布をしていれば、95%のデータが入るわけですから、まあ納得できます。2σの範囲は、spssなどの統計ソフトを利用すれば、簡単に作図されます。
>回帰分析後、決定係数を出したのですが、どれも低く
回帰式で、原因と推定される事項については、いろいろなことが考えられます。この場合は、重回帰分析という手段をとるのが一般的です。それでも、人間世界の事象についしては、決定係数が0.5より大きくなるのは大変でしょう。私の場合は、年度ごと、すなわち、マクロですので、まだ傾向が見えました。
株価は、毎日が勝負。これはミクロ経済ですよね。プロ野球でも、年間を通せば、上位チームは予想できます(評論家は、必ず外してくれます)が、今日の勝負は、予想が困難だと思います(野球賭博では可能とか)。
株は、上がるか下がるかの丁半バクチ、さいころの出目を予想するのに似ているので、株についての分析は進めていません。私より賢い人が、大型コンピュータを使っても、大損する世界ですし、・・・。「投資」『投資』、と騙されている人がいますが、バクチであることは、経済学部の教授に確認済みです。
ちなみに、相関分析と回帰分析は、世間では同一視されています。が、相関分析は因果関係の判定要因の一つ(何故それが原因になるのかの説明が必要)、回帰分析は、予想が当たればそれで十分、因果関係は不要です。
再び投稿頂いてありがとうございました。
仰るとおり、数々の要因があるので株価予測が当たる確立は低いと思います。
私のは論文の実証分析のためなので、株価があるイベントによって上がったと認められるという程度でいいのですが、集めた過去のデータに相関関係がないのであれば、それを除かないとイベント前後の比較にも影響が出るのではないかと思いました。
>散布図で、回帰式から外れる点については、回帰式の上下に±2σの範囲を取り、その範囲から外れる点は、棄却するというのがあります。
説明不足でしたが、サンプル群が700件程度あり、それぞれに回帰分析後、決定関数を求めています。700件それぞれに相関関係があるのかを調べ、低いものは除きたいと考えておりました。そして、その平均値をもって株価の動きを分析したかったのです。
どのようにするのか他にも色々と調べたいと思います。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
イベントスタディ分析
-
近似直線の傾き同士の相関
-
ローリング回帰とはなんですか?
-
4つのサイコロを同時に振って...
-
2つのサイコロの目の合計が偶数...
-
重複順列
-
五分を6回連続で外すのはなん...
-
一般常識を教えてください。1割...
-
サイコロ5個を同時に投げて任意...
-
数学の質問です。 1〜6までの番...
-
75%を3回連続で引かない確率
-
街の中や駅で好きな人にばった...
-
確率で「試行の独立」「事象の...
-
じゃんけんの問題
-
大学入試の数学
-
3個のサイコロを同時に1回振る...
-
サイコロを三つ同時に振るとき ...
-
確率0.02%って10000人に2人です...
-
トランプ 確率
-
4つのサイコロを同時に振る時の...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
近似直線の傾き同士の相関
-
クロスカントリー分析・クロス...
-
イベントスタディ分析
-
ローリング回帰とはなんですか?
-
<計量経済学>定数項のない回...
-
統計ソフトRの重回帰分析で困っ...
-
一次同時(次?)について質問...
-
回帰分析の結果
-
回帰分析の時に対数をとる意味は?
-
重回帰分析におけるP値とデー...
-
多変量解析の手法
-
重回帰のダミー変数について
-
最小2乗法→回帰分析→?
-
相関係数の特徴
-
回帰分析の際のデータの指数化
-
重回帰分析をして仮説検定を行...
-
回帰分析:理論値と実績値の差...
-
エクセルの回帰分析について
-
4つのサイコロを同時に振って...
-
2つのサイコロの目の合計が偶数...
おすすめ情報