統計に関して全くの素人なもので、お力をお貸しいただけると大変助かります。
現在、仕事でレポートを作成しており、政府統計調査のデータを根拠として示したいのですが、標本調査結果に添付されている「推定値の大きさ別標準誤差率」を見ると、同じ調査でもデータの大きさによって1%未満から30%以上の標本誤差率が存在します。
レポートをまとめる際、例えば同じ「業種別の工場数」の表を記載する場合でも、都道府県ごとなら結果精度が保てても、市区町村ごとでは誤差率が大きくなるため不適切、といったことに注意しなければならないと思うのですが、
一般的に、標準誤差率が何%までなら「信頼できる推定値」といえるのでしょうか(あるいは定義があるのでしょうか)。
ご教示よろしくお願い申し上げます。
No.4ベストアンサー
- 回答日時:
こんにちは。
補足をありがとうございました。
>>>>>
そもそもの疑問が、標準誤差率5%のA県の推定値と30%のB町の推定値から、「A県全体では○○業の工場の割合が35%だが、B町では60%で、25ポイント上回っている」などと結論づけてよいのだろうか?ということでした。
標準誤差率1%の全国結果とA県となら同じように比較してもある程度実態(母集団の平均値?)を反映した結果になると思うのですが、ただの感覚的なものなので、標準誤差率○%以下なら・・みたいな目安はあるのだろうか?と思った次第です。
なるほど。ご質問の趣旨がわかってきました。
それは、「有意差検定」と言います。
「有意差」というのは、文字通り、意味のある差という意味です。
2者(A,B)を比較して、
「AとBは、危険率○○%で、有意差がある。」
というような言い方をします。
「危険率」というのは、有意差検定の結論が間違いである確率のことです。
(注意!: 当然ながら危険率は、標準誤差のことではありません。勿論、標準誤差に関係はありますけれども。)
検定を行うに当たっては、どれだけの危険率を設定するかは、検定を行う人の自由です。
危険率を小さく設定すればするほど、信頼の置ける「厳しい検定」となり、その代わり、有意差なしという結論が出やすくなります。
どれだけの危険率で検定を行うかを最初に「決心」した上で、検定を行います。
http://www.blufi.co.jp/archives/24344389.html
http://www.shiga-med.ac.jp/~koyama/stat/test.html
ここから先は詳しくない(というか、昔やりましたが、ここ10年以上やったことがない)ので、この辺で筆を置かせていただきたいと思います。
ご回答くださりありがとうございました。お礼が遅くなり申し訳ありません。お陰様で、入り口での私の疑問は解決したように思います。
「有意差検定」というのですね。統計学ではきっと基本中の基本みたいなことをお伺いしてしまったにもかかわらず、参考URLまで教えていただきありがとうございました。サイトを拝見したとき、冒頭の数式でもうダメだ・・・と思ってしまったですが、エクセルやWeb上で検定できるプログラムもあることが分かり、試してみようと思います。
いずれにしろ、まずは自分で勉強することが必要なことがよく分かりました。たびたびの拙い質問にご回答いただき、ありがとうございました。
No.3
- 回答日時:
統計学でいう標準誤差とは、いくつかのサンプルを得た場合、その平均値とデータのバラつき(標準偏差という)で示します。
また、何度もサンプルを得ると、その平均値は同じにならない、すなわち平均値にもバラつきがあり、これを標準誤差と言います。このバラつきが小さいほど、その結果に信頼性が高いのですが、統計学では、どの程度だと信頼する、という定義はありません。機器では、精度と表現されていますが、0.1~0.2%程度なら許容範囲でしょう。
データの信頼性については、バラツキ(精度)だけでは不十分です。測定した値そのものの信頼性です。鉛筆の長さをを測定する場合、いい加減なものさしを使うと、長さそのものが違ってきます。これを確度といいます。ですから、測定値の信頼性については、精度と確度の二つを満たす必要があります。
>、標準誤差率が何%までなら「信頼できる推定値」
測定データだと、短い処理か処理工程が長いかにもよりますが、学生の実習だと、5%程度。私は2%以内が目標。分析のプロだと、0.5%以内、と聞いたことがあります。
統計学は、魔法の小箱、という印象があるようですが、検定の結果いえるのは、「有意差がある」ということだけです。「差が無い」はもちろん、「差が大きいとか小さい」とかも、主張できません。その程度の代物です。ですから、「信頼できる推定」を標準誤差から決めるなんぞはできません。ただ、『信頼できない』と判断する数値を公表する人はいないでしょうが(嘘つきになります)、現実には間違っている場合も。
>「業種別の工場数」
工場については、0か1、まぎれることがありません。0.3の潰れかけなんぞは無いからです。誰でも、正確に数えられるので、バラツクことはないと想うのですが。
そうすると、平均はありえませんので、標準誤差も計算できません。
「お宅は、工場ですが」なんぞの同じアンケートを100通だします。これを3回繰り返すと、工場だという回答数は違ってくるので、平均も標準偏差、標準誤差も計算できますが、アンケートを繰り返すような馬鹿な真似はしないでしょうし・・・。
工場の人数なら、工場によって異なるので、標準誤差は出せます。
ご回答くださりありがとうございました。お礼が遅くなり申し訳ありません。
>検定の結果いえるのは、「有意差がある」ということだけです。「差が無い」はもちろん、「差が大きいとか小さい」とかも、主張できません。
>『信頼できない』と判断する数値を公表する人はいないでしょうが(嘘つきになります)、現実には間違っている場合も。
統計の数値と自分が仕事の経験などから得た実感がズレているなあと感じることがあり、標準誤差の大小で採用するデータを決めたらいいのかな?と思ったのですが、そういうことではないのですね。
拙い質問に丁寧にご回答いただき、ありがとうございました。
No.2
- 回答日時:
標準誤差率、つまりは無次元化された標準偏差ですよね。
これはデータの信頼性を測るものではありません。例えばモノサシで長さを測るとき、測る対象自体の誤差とモノサシが持つ欠陥による測定誤差とが加わったものが測定値として出て来ます。信頼できるデータというのは後者の誤差が少ないことを指すので、両者が混じったデータでは測定値の信頼性を測ることはできません。それを測るには測定誤差が分かっていて、それがじゅうぶん小さい計器によるデータと当該測定器によるデータを比較することで達成できます。その標準偏差値の差のパーセンテージがじゅうぶんに小さいとき、その計器は信頼性があると判断でき、従って取れたデータが信頼できるということになります。
ですからある村の標準誤差率が高いからその測定が杜撰ということにはならないのです。データ自体がばらついている可能性があるからです。
こんな夜中に私の拙い疑問にご回答いただき、ありがとうございました。数学のできる方の文章は理路整然と簡潔ですごいです。それなのに私の質問ときたら・・・・。もう少し勉強して自分の頭を整理したいと思います。
No.1
- 回答日時:
こんばんは。
ちょっと失礼な言い方になりますけど、勘弁してくださいね。
「一般的に、標準誤差率が何%までなら「信頼できる推定値」といえるのでしょうか」
という考え方が、すでに間違っています。
標準誤差や標準偏差というのは、
“ある一定の確率で「±誤差%」という範囲の中に入ります”
ということなのです。
つまり、工場Aでの 500±1% と、工場Bでの 500±30% というものを比較したとき、
「500±1%」の信頼度と「500±30%」の信頼度は、全く同じです。
「信頼度」と「ばらつきの大きさ」というのは、全く次元の違う言葉なのです。
市町村毎の結果が、都道府県毎の結果よりもばらつきが大きくなることは当たり前なので、統計処理した結果の表において、大きい標準誤差なり小さい標準誤差なりを、そのまま「正直に」平均値の横に記載すればよいだけの話です。
以上、ご参考になりましたら。
この回答への補足
こんなに早く、訳の分かっていない私にも分かるようにご丁寧な回答をいただき本当にありがとうございました(全然失礼じゃないです)。それなのにまた勉強不足な疑問で大変恐縮なのですが・・・。
そもそもの疑問が、標準誤差率5%のA県の推定値と30%のB町の推定値から、「A県全体では○○業の工場の割合が35%だが、B町では60%で、25ポイント上回っている」などと結論づけてよいのだろうか?ということでした。
標準誤差率1%の全国結果とA県となら同じように比較してもある程度実態(母集団の平均値?)を反映した結果になると思うのですが、ただの感覚的なものなので、標準誤差率○%以下なら・・みたいな目安はあるのだろうか?と思った次第です。
質問の趣旨が分かりにくくてすみません(この考え方自体間違っていましたらご容赦ください・・・)。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
このQ&Aを見た人はこんなQ&Aも見ています
-
家の中でのこだわりスペースはどこですか?
自分の家で快適に過ごすために工夫しているスペースはありますか? 例)ベランダでお茶を飲むためのカフェテーブル ゲーミングに特化したこだわりのPCスペース
-
秘密基地、どこに作った?
小さい頃、1度は誰もが作ったであろう秘密基地。 大人の今だからこそ言える、あなたの秘密基地の場所を教えてください!
-
【お題】引っかけ問題(締め切り10月27日(日)23時)
【大喜利】 「日本で一番高い山は富士山……ですが!」から始まった、それは当てられるわけ無いだろ!と思ったクイズの問題
-
昨日見た夢を教えて下さい
たまにすごいドラマチックな夢見ること、ありませんか? 起きてからも妙に記憶に残っているような、そんな夢。
-
あなたの習慣について教えてください!!
あなたが習慣だと思って実践しているものを共有してくださいませんか? 筋肉トレーニングでも朝シャワーでも、あなたが習慣だなと思えば何でも構いません
-
実験における誤差範囲の許容範囲の決め方ってどうやればいいんですか? また、一般的には具体的にどこ程度
大学・短大
-
誤差率が1%はおおきいですか?小さいですか? 小さいと言っても良い範囲とかありますか?
物理学
-
相対誤差が小さいと判断する基準がわからないのでどのような値になったら小さいと判断してよいのか教えてほ
大学・短大
-
-
4
誤差について教えてください、、 誤差率は、 (測定値ー真値)/真値 だと思っていますが。 ある先輩か
その他(教育・科学・学問)
-
5
標準偏差
数学
-
6
誤差について
物理学
-
7
相対誤差の求め方と許容範囲
物理学
-
8
ワードに「URL」を貼り付けると、文字が黒だったり青だったり?
その他(パソコン・スマホ・電化製品)
-
9
等吸収点
化学
-
10
t検定で自由度がn-1の場合と、n-2の場合の違いは??
数学
-
11
lnの読み方
数学
-
12
男性に質問:彼女をオカズにしますか?
セックスレス
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・【大喜利】【投稿~11/12】 急に朝起こしてきた母親に言われた一言とは?
- ・好きな和訳タイトルを教えてください
- ・うちのカレーにはこれが入ってる!って食材ありますか?
- ・好きな「お肉」は?
- ・あなたは何にトキメキますか?
- ・おすすめのモーニング・朝食メニューを教えて!
- ・「覚え間違い」を教えてください!
- ・とっておきの手土産を教えて
- ・「平成」を感じるもの
- ・秘密基地、どこに作った?
- ・【お題】NEW演歌
- ・カンパ〜イ!←最初の1杯目、なに頼む?
- ・一回も披露したことのない豆知識
- ・これ何て呼びますか
- ・チョコミントアイス
- ・初めて自分の家と他人の家が違う、と意識した時
- ・「これはヤバかったな」という遅刻エピソード
- ・これ何て呼びますか Part2
- ・許せない心理テスト
- ・この人頭いいなと思ったエピソード
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・あなたの習慣について教えてください!!
- ・ハマっている「お菓子」を教えて!
- ・高校三年生の合唱祭で何を歌いましたか?
- ・【大喜利】【投稿~11/1】 存在しそうで存在しないモノマネ芸人の名前を教えてください
- ・好きなおでんの具材ドラフト会議しましょう
- ・餃子を食べるとき、何をつけますか?
- ・あなたの「必」の書き順を教えてください
- ・ギリギリ行けるお一人様のライン
- ・10代と話して驚いたこと
- ・家の中でのこだわりスペースはどこですか?
- ・つい集めてしまうものはなんですか?
- ・自分のセンスや笑いの好みに影響を受けた作品を教えて
- ・【お題】引っかけ問題(締め切り10月27日(日)23時)
- ・大人になっても苦手な食べ物、ありますか?
- ・14歳の自分に衝撃の事実を告げてください
- ・架空の映画のネタバレレビュー
- ・「お昼の放送」の思い出
- ・昨日見た夢を教えて下さい
- ・ちょっと先の未来クイズ第4問
- ・【大喜利】【投稿~10/21(月)】買ったばかりの自転車を分解してひと言
- ・メモのコツを教えてください!
- ・CDの保有枚数を教えてください
- ・ホテルを選ぶとき、これだけは譲れない条件TOP3は?
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・【コナン30周年】嘘でしょ!?と思った○○周年を教えて【ハルヒ20周年】
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
効果量のマイナス表示に関して
-
Mann-WhitneyのU検定をspss統計...
-
サンプルサイズが極端に少ない...
-
統計論文:ノンパラメトリック...
-
統計解析で何を用いればよいの...
-
統計学的に信頼できるサンプル...
-
t検定・Χ二乗検定について t...
-
統計解析ソフトを探しています
-
最小有意差とは?
-
統計学のP検定とt検定につい...
-
2群間平均の差の検定 差が“な...
-
エクセルを使いABCDの中で...
-
英語論文に出てくる「independe...
-
五分を6回連続で外すのはなん...
-
2つのサイコロの目の合計が偶数...
-
4つのサイコロを同時に振って...
-
統計学の問題なんですが・・・
-
重複順列
-
一般常識を教えてください。1割...
-
数学の質問です。 サイコロ2つ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
効果量のマイナス表示に関して
-
調査結果は、標準誤差率が何%...
-
p値の計算式
-
統計学のP検定とt検定につい...
-
統計のt検定について
-
英語論文に出てくる「independe...
-
統計学的に信頼できるサンプル...
-
Mann-WhitneyのU検定をspss統計...
-
サンプルサイズの大きく違うF検定
-
母集団の違う2つの平均値の優...
-
最小有意差とは?
-
平均値、標準偏差、変動係数に...
-
Mann-Whitney検定を採用できる2...
-
有意差について
-
2群間平均の差の検定 差が“な...
-
統計論文:ノンパラメトリック...
-
スミルノフ・グラブス検定の有...
-
回帰曲線の有意差の検定
-
有意差が無いことを証明(危険...
-
Excelでスミルノフ・グラッブス...
おすすめ情報