色彩検定1級を取得する魅力を紹介♪

地球温暖化によって洪水などの水災害が増加しているということが言われるようになっています(近年の報道はそういう方向性です)。事の当否は別にして、異常な状態になったということは統計による母数が従前と異なったということになるのでしょうか。統計学の本を読むと統計学の目的は母数(母平均、母分散、母比率)の値とか存在区間を推定することと言えそうです。あるいは異常状態である・なしを検定するのも統計の役割ですね。ということになると統計学として異常気象(その他の異常といわれる現象一般でも)に母数に絡めてなんらかの言及がなされているはずだと思います。おそらく一般に理解させることができないのでその辺を極力言わないで結果(異常状態に突入した)だけ言ってるのだろうと思いますが、統計的な言及としてはどうなっているのでしょうか。ただ、統計の初等的なテキストではある確率変数がN(0,1)とか自由度(n-1)のカイ二乗分布などに帰着する場合でもそれは前提条件付き(独立性とかいろいろ)なので実際問題としては難解になってフォローできないかもしれませんが、よろしくお願いします。
 昨夏はアメダス観測点1300点のうち100点以上で何らかの観測値についてこれまでの最大記録(40年ぐらいの中で)を更新したということでした。これは統計的にどのように評価するのか、ということですが。
 アメダスが設置された2年目だったら、過去(1年しかない)の記録を更新するのはだいたい半分の観測点で見られるはずですね。感情ではなく客観的な数値として今の状況を評価したいと思っているのですが。観測を参照しながら母数を推定していくことってまさにベイズ統計の事後確率みたいに見えるのですが。あるいはカルマンフィルタとか。

gooドクター

A 回答 (3件)

統計はいくらでもウソがつけます。



たとえば「毎日コーヒーを飲む人は、飲まない人に比べて平均5年長生きする」(本当かどうかは分かりません。単なる「例」です)というものがあったとして、それはそれで「統計的にそういう結果だ」ということがあるにしても、例えばその背後にある
・コーヒーを毎日飲めるということは、それなりの性状が安定した先進国に暮らしている。
・安定した生活を送っている。
・それなりの経済的余裕がある。
ということを併せて考える必要があります。

そうすると、長生きできているのは「コーヒーを飲む習慣」によるものではなく、「安定した社会環境」「生活習慣」の方に理由がある可能性が高いことが分かります。

ある仮説を検証したいときに、どんなデータを集めて来るかによって、ある意味で「風が吹けば桶屋が儲かる」ことも検証できてしまいます。
そういった「因果関係」は、実はいろいろ複合的に影響しあっていて、「ああも言えるし、こうも言える」ということが多いです。
質問者さんのおっしゃる「母数(母平均、母分散、母比率)」が「何の母数か」という定義そのものが難しいとも思います。「何を見るか、どこまでを見るか」という範囲をどうするかによって変わります。

ちっともご質問の回答にはなっていませんが、そういうことも頭の片隅に置いてみてはいかがかと思います。
    • good
    • 0
この回答へのお礼

懇篤な回答ありがとうございます。統計はデータの集め方にトリックを忍ばせて結果を都合よく操作できると思います。
 ただ、ご指摘のコーヒーと寿命の事例だとコーヒー以外の条件を同じにしなければ統計として意味がないですね。毎日コーヒーを飲むということの中にコーヒーを毎日飲めるだけの余裕がある人、コーヒーを毎日飲まない人はそれだけの余裕がない人という表に出ない事情が含まれているとしたら、それは統計が悪いというより、統計の使い方にミスがある、あるいは(それと知っての)統計の悪用ということではないかと思います。うそをつくというか、間違いに気が付かないということにもなるかもしれません。
 私が今回お尋ねしたのは、統計的な処理すらない状態で”こんな酷い状態なんだ”というような言説が見受けられるからなのです。少なくとも(ミスには気を付けないといけないけど)統計学の知見に照らして何か言ってほしいということなのです。それが、例えば母数が変わった可能性がある、ということです。母数が変わるということはサイコロに例えると、「何か目の出方大きくなっているぞ、このサイコロ、7面になっていて5が2面になってないるようだ,1,2,3,4,5,5,6の7面?」というようなことを見破る、あるいはその可能性を評価する、ということです。
 話が飛びますが、今般のコロナ禍はその背景となるデータは毎日の感染者数(保健所からの報告)ですね。これは市中の感染者数(無症状ウィルス保有者含む)ではないが、それが毎日の感染者との比例関係にあるということを仮定していると思います。そうすると、市中の感染者数(あるいは比率)を知るためには無作為抽出による感染調査しかないんじゃないかと思うのですが。毎日の感染者で一喜一憂するなら、毎日の感染からの回復者数も提示して感染者の総数の増減を示して欲しいと思います。統計ではデータの取り方について言及する必要があるということに触発されました。

お礼日時:2021/05/10 00:37

その年の気象の傾向を語る場合、過去30年の平均がもとになっている。


だから「今年の7月下旬の最高気温は高め」というのは
「過去30年の平均と比較して」
という但し書きが付く。

長期的な気候変動を調べたい場合は、過去のデータの蓄積がある観測点ほど観測値の価値が高い。

ただ、一口に長期的な気候変動と言っても、5W1Hに応じて様々な処理方法があるので、ここで一口には言えない。
    • good
    • 0
この回答へのお礼

回答ありがとうございます。データに基づいて母数について何か結論とか判断を言うとき、その根拠を統計の力を借りて何か言うというのがルールなのではないかと思います。検定とか区間推定とか、やや根拠が薄弱だとしても、そのことを言い添えることが大事なのではないかと思うのですが。十分な裏付けはない、ということも含めてですが。つまり、結論はまだ十分な裏付けはなくて完全に信用できないけれど、それを言った人の誠実は評価できると思うのです。確率・統計は決定論ではないから常に額面通り結果を受け入れることができないことが前提となるがゆえに必ず裏付けの理由が欲しいのですが。

お礼日時:2021/05/10 23:49

統計や母数は、殆ど考慮されずに単に「過去には無かった事が起きた」とか、「ここ数年は無かったが今年は数回も起きた」とかの言い方をしていると思います。

    • good
    • 0
この回答へのお礼

回答ありがとうございます。過去になかったことが起きたのは全計測点で何点であり、その結果、”仮説検定によって〇〇が言える”、というような展開です。そういう風に大変なことが起こったらそれがどの程度のことなのかを客観的に示すというようなことです。そうしないと”たいへんだ、たいへんだ”と騒いでいるだけになってしまうからです。マスコミなんかを見ているとそういう風に見えるのです。

お礼日時:2021/05/10 00:50

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

gooドクター

このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング