サンプル選定の仕方で悩んでいます。詳しい方、教えて下さい。統計初心者ですので、表現の仕方などが間違っているかもしれません。
相関関係のあると思われる2群のサンプルについて、適切なサンプル(相関が認められる)のみを選び出したいのですが、方法は次の通りでいいのでしょうか。
(1) F検定をして、母集団の分散が等しい場合と異なっている場合に分ける。
(2) (1)の結果を基にT検定でP値を求める。
(3) (2)の結果が5%未満であるものをサンプルとして選定する。
上の方法が間違っていない事が前提ですが、(3)のP値が5%未満になると有意差があるという説明がサンプルとして選ぶべきか選ばないという事を意味しているのか確信がありません。
よろしくお願いします。
No.1ベストアンサー
- 回答日時:
>方法は次の通りでいいのでしょうか。
書かれていることが、バラバラです。
というのも、相関関係は、AとBとの関係の有無、例えば身長と体重に関係があるか否かを判断する者。散布図を描き、相関係数と回帰式を算出します。
t-検定と、F-検定は、2群(1年生と2年生など)の平均値に、有意差があるか否かを判定するものです。
>適切なサンプル(相関が認められる)のみを選び出したいのですが
これは、都合の悪いデータを棄てる、ということで、統計学ではやってはならないことです。ただし、異常と判断されるデータを棄てる棄却検定というのは認められていますが、初心者が適正にやれるとは想えません。
1) どのようにしてデータを集めたのか、
2) 平均値の差を言いたいのか、両者に関係があることを言いたいのか、目的をハッキリさせ無い限り・・・。
訳の分からない質問にご回答下さりありがとうございました。
過去のデータ(株価の動き)を基にある事項が起こった時に異常リターンが発生するか調べようとしています。過去のデータ(2集団)に相関関係にあるかを吟味し、相関関係にないと思われるサンプルデータを除きたいと思うのです。
回帰分析後、決定係数を出したのですが、どれも低くそのデータを除くのは止め、他に方法はないかと調べておりました。
T検定は相関関係を調べる手段にはならないんですね。的外れな事をやろうとしていました。
No.3
- 回答日時:
特定の銘柄について日々の株価推移を予測するのは不可能ですが、
分野別だったり過去のデータにおける変動要因の推定はある程度可能だと思います。
こんな分析に意味があるかどうかはさておき、夏季の気温上昇と飲料メーカー株・家電メーカー株などは分析するまでもなく正の相関が認められます。また、M&Aや新技術の発表を期に上昇する銘柄は腐るほどあります。その他としては金利の変動に伴う株価の上下なども国際間の金利水準の相対的変化においては意味があります。
どういう分析をしようとしているのかいまいちピンとこないので適当なことを書いていますが、個別具体の事象を分析するのは不可能に等しいので、取り組まれるのであればやはり大まかな流れにとどめるのが良いのではないでしょうか?
技術的なことに関しては詳しくないのでパスさせていただきます。
ってそれじゃ役には立ちませんね(汗
アドバイスどうもありがとうございました。
その後、Pearson検定が出来るソフト試用版を見つけ試してみました。相関関係について目安になるようです。全てを検定するのは出来ないので、怪しいものをピックアップして検定をする事にしました。
No.2
- 回答日時:
株価について、私がやった分析は、横軸に年度の一人当たりのGNP、縦軸に平均株価を取りました。
その散布図を描くと、一目でバブル期は異常に上がっている、と判断できました。この場合、バブル前の回帰式と、バブル期後の回帰式が異なることを示せば良いのですが、私にとってはどうでも良いことなので、やっていません。
>相関関係にないと思われるサンプルデータを除きたい
散布図で、回帰式から外れる点については、回帰式の上下に±2σの範囲を取り、その範囲から外れる点は、棄却するというのがあります。
2σは、正規分布をしていれば、95%のデータが入るわけですから、まあ納得できます。2σの範囲は、spssなどの統計ソフトを利用すれば、簡単に作図されます。
>回帰分析後、決定係数を出したのですが、どれも低く
回帰式で、原因と推定される事項については、いろいろなことが考えられます。この場合は、重回帰分析という手段をとるのが一般的です。それでも、人間世界の事象についしては、決定係数が0.5より大きくなるのは大変でしょう。私の場合は、年度ごと、すなわち、マクロですので、まだ傾向が見えました。
株価は、毎日が勝負。これはミクロ経済ですよね。プロ野球でも、年間を通せば、上位チームは予想できます(評論家は、必ず外してくれます)が、今日の勝負は、予想が困難だと思います(野球賭博では可能とか)。
株は、上がるか下がるかの丁半バクチ、さいころの出目を予想するのに似ているので、株についての分析は進めていません。私より賢い人が、大型コンピュータを使っても、大損する世界ですし、・・・。「投資」『投資』、と騙されている人がいますが、バクチであることは、経済学部の教授に確認済みです。
ちなみに、相関分析と回帰分析は、世間では同一視されています。が、相関分析は因果関係の判定要因の一つ(何故それが原因になるのかの説明が必要)、回帰分析は、予想が当たればそれで十分、因果関係は不要です。
再び投稿頂いてありがとうございました。
仰るとおり、数々の要因があるので株価予測が当たる確立は低いと思います。
私のは論文の実証分析のためなので、株価があるイベントによって上がったと認められるという程度でいいのですが、集めた過去のデータに相関関係がないのであれば、それを除かないとイベント前後の比較にも影響が出るのではないかと思いました。
>散布図で、回帰式から外れる点については、回帰式の上下に±2σの範囲を取り、その範囲から外れる点は、棄却するというのがあります。
説明不足でしたが、サンプル群が700件程度あり、それぞれに回帰分析後、決定関数を求めています。700件それぞれに相関関係があるのかを調べ、低いものは除きたいと考えておりました。そして、その平均値をもって株価の動きを分析したかったのです。
どのようにするのか他にも色々と調べたいと思います。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 政治学 もはや選挙は「サンプル調査」なのか? 1 2023/04/15 14:30
- 統計学 3シグマ管理 10 2022/09/02 07:29
- 統計学 統計学の質問【帰無仮説】 W大学のP学部において、自宅通学者の比率にについて調べたい。 P学部から1 8 2023/05/25 23:28
- 統計学 理論値と実測値の検定方法 3 2022/04/19 09:32
- 政治 コンピューターで政党支持のアンケートをするのって、結果にどんな影響が出るでしょう? 5 2023/03/22 17:49
- 統計学 ある会社の製品全体の質量mを推定したい。その製品をn個無作為に選んで測ったところn個の平均はm0であ 3 2022/07/29 12:18
- クーポン・割引券 dカードゴールドの年会費特典をサンプル百貨店にしたら 3 2022/08/08 10:02
- 統計学 比率に関する質問ですが 例えば 1)初めの物質Aというものの濃度は知らないが 物質Aに溶媒を3回添加 5 2023/04/02 00:27
- 統計学 t検定について教えてください 2 2023/02/23 16:35
- 統計学 生物統計学の質問 3 2022/11/11 21:14
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
イヤーダミーについて
-
BINGが間違えた、とっても簡単...
-
重複順列
-
4つのサイコロを同時に振って...
-
確率の問題 数学と実生活と
-
統計学の問題なんですが・・・
-
一般常識を教えてください。1割...
-
調査結果は、標準誤差率が何%...
-
3σについて教えてください(基...
-
6人が円形のテーブルを囲んで座...
-
P(A|B)などの読み方
-
統計学的に信頼できるサンプル...
-
5人の人々を3人と2人のグループ...
-
サイコロの目が10回目に「1」が...
-
00~99、AA~ZZの組み合わせっ...
-
a.b.c.d.eの5個から3個を選んで...
-
数学の質問です。 一枚の硬貨を...
-
サイコロを6回振って1回も1が...
-
効果量のマイナス表示に関して
-
サイコロを三つ同時に振るとき ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
近似直線の傾き同士の相関
-
クロスカントリー分析・クロス...
-
イベントスタディ分析
-
計量経済の問題
-
重回帰分析におけるP値とデー...
-
GDP統計の「寄与度」、「寄与率」
-
回帰分析の時に対数をとる意味は?
-
因子分析における因子得点の解...
-
相関係数の特徴
-
回帰分析の際のデータの指数化
-
回帰分析の目的変数と説明変数...
-
夏に気温が上がるとビールの売...
-
統計ソフトRの重回帰分析で困っ...
-
ローリング回帰とはなんですか?
-
回帰分析:理論値と実績値の差...
-
モンテカルロシュミレーション...
-
4つのサイコロを同時に振って...
-
重複順列
-
統計学の問題なんですが・・・
-
2つのサイコロの目の合計が偶数...
おすすめ情報