はじめまして。私はあるメーカーで品質管理を担当しております。
通常、完成した製品の性能を測定しする工程において、製品の本来の性能を測定することが困難なため、測定のできる代表特性で、製品本来の性能を推定する手法と
して、日科技連のJUSE-QCASの散布図を用いております。しかしながら、このソフトが高価であり、しかも工程の作業者がソフトを使えるように操作習得が必要なため、工程での利用がしにくいため、工程の責任者から、「Excelなら誰でも
つかえるから、Excelベースで散布図を作れないか?」との相談がありました。
私なりにいろいろやってみると、Excelのワークシートにxデータとyデータ
を入力すると散布図を書き、相関係数rを表示し、回帰直線を書くところまでは
Excelの機能でできましたが、「回帰直線の95%信頼区間」と「データの95%信頼
区間」だけ表示のしかたがわかりません。
Excelでこのようなことができるのでしょうか?もしできれば、どのようにしたら
良いのかお教えください

このQ&Aに関連する最新のQ&A

A 回答 (1件)

回答なしで流れてしまいそうなので・・・・



95%信頼区間って、2シグマでしたっけ?3シグマ?
とにかく、回帰直線の式をもとに、実際のデータ(x)をいくつか作り、yを計算し、それに2シグマなりをプラスマイナスしてデータ(x,yの組)を作って、グラフを描けばいいのではないかと思いますが、ご質問の裏にもっとすごい要求があるのでしょうか?
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q統計の問題 信頼区間と信頼係数について

統計初心者です。
下記の問題を拝見したのですが、さっぱり分かりませんでした。

ある集団でのイベント発生確率に対する信頼区間の信頼係数を90%から99%に変化させたとする。
他の条件は同じだとして、信頼区間幅に関する記述のうち正しいものはどれか。
次のうちから1つ選べ。
 1 信頼区間幅が57%増加する
 2 信頼区間幅が57%減少する
 3 信頼区間幅が9%増加する
 4 信頼区間幅が9%減少する

「信頼区間幅」というのは統計検定における95%や99%とはまったく別のものと解釈してよろしいでしょうか?
また、解答欄の57%や9%という数字がどこからきたのか全く分かりません。
(1.96や2.57だったらなんとなく分かります)

数式的な理解は難しいので、できるだけ数式を使用しないで教えていただけるとありがたいです。
よろしくお願いします。

Aベストアンサー

統計って、なんか話がややこしいですよね。

 信頼区間の話は、よく出て来る「正規分布」のカーブを思い浮かべると理解できると思います。
 「正規分布」は、平均値をピークに、左右にダラ下がりの分布です。標準偏差を「σ」として、
  平均値± σ の範囲に、全体の 68.3% が入る
  平均値±2σ の範囲に、全体の 95.4% が入る
  平均値±3σ の範囲に、全体の 99.7% が入る
ということになります。
 質問者さんのおっしゃる「1.96」や「2.57」は
  平均値± 1.96σ の範囲に、全体の 95.0% が入る
  平均値± 2.57σ の範囲に、全体の 99.0% が入る
という意味ですね。(σ側ではなく「全体の○○%」の方を基準にした言い方)
http://www.stat.go.jp/koukou/howto/process/p4_3_2_1.htm 

 この「σの何倍」で表わされる方が「信頼区間」です。
 全体の何%がその範囲に入るかを表わす方が「信頼係数」です。
 「信頼」と付いているのは、「その範囲に入る」という意味合いだからでしょう。(「その範囲から外れる」場合には「危険率」とか「有意」(=違いに意味がある)と言います)

 たとえば、テストの点数で、「80%の生徒が50~70点の範囲に入る」なら、「信頼係数(=信頼度)80%の、点数の信頼区間は50~70点である」という感じ。

 当然、信頼係数を大きくして「90%の生徒が」とか「99%の生徒が」といえば、「信頼区間」も大きくなります。
 「信頼係数(=信頼度)80%の信頼区間は50~70点である」=50~70点の範囲に生徒の80%が入る
 「信頼係数(=信頼度)90%の信頼区間は40~85点である」=40~80点の範囲に生徒の90%が入る
 「信頼係数(=信頼度)99%の信頼区間は10~98点である」=10~98点の範囲に生徒の99%が入る(ほとんど全員?)
という感じ。

 上の例で分かるように、「信頼係数(=信頼度)」の数値と、「信頼区間」の数値には直接の関係はありません。
 ですから、ご質問の問題も「意味不明」です。定性的に「信頼係数を90%から99%に変化させたのだから、信頼区間幅は増加する」と言えても、これが「57%」か「9%」かは特定できません。そもそも「信頼区間幅の%って何?」という定義も必要ですし。
 無理やりこじつけると、上の正規分布の例の延長で、正規分布表を調べてみると、
  平均値± 1.64σ の範囲に、全体の 90% が入る
  平均値± 2.57σ の範囲に、全体の 99% が入る
ということで、信頼区間の比をとると 2.57σ/1.64σ ≒ 1.57 、つまり「1」が正解ということかもしれません。でも、それは「正規分布」などの「前提条件」を付け、かつ「正規分布表」などの数値データを提示しないと判定できません。

 質問者さんの疑問は当然のものと思います。お示しの問題は「悪問」もしくは「特別の前提条件が提示された上での問題」なのではないかと思います。

統計って、なんか話がややこしいですよね。

 信頼区間の話は、よく出て来る「正規分布」のカーブを思い浮かべると理解できると思います。
 「正規分布」は、平均値をピークに、左右にダラ下がりの分布です。標準偏差を「σ」として、
  平均値± σ の範囲に、全体の 68.3% が入る
  平均値±2σ の範囲に、全体の 95.4% が入る
  平均値±3σ の範囲に、全体の 99.7% が入る
ということになります。
 質問者さんのおっしゃる「1.96」や「2.57」は
  平均値± 1.96σ の範囲に、全体の 95.0% が入る
  平...続きを読む

Q散布図に回帰直線の反映方法

散布図に回帰直線を反映させたいのですが、他の質問に対する回答で、
近似曲線の追加を選択から反映可能とのことで試したところ、追加対象の系列が複数あるためかうまく反映しません。他に方法はないでしょうか。
ちなみに、散布図は以下のデータの形から作成してます。
よろしくお願い致します。

 ア イ ウ エ
1 A
2   B
3     C
4       d

Aベストアンサー






系列オを追加近似曲線表示
マーカーなし

Q信頼区間0%

統計でよく用いられる信頼区間についての質問です。

95%信頼区間の意味は「真の値を95%の確立で含んでいる区間」ではなく、「100回中95回は真値を含む」という意味であることはなんとなく理解出来ているつもりでいるのですが・・・。

リスク差の信頼区間を出す問題なのですが、
「0%信頼区間は何を意味しているのか」、という意地悪な質問をされて困っています。

分かる方は是非教えてください!
よろしくお願い致します。

Aベストアンサー

私は、95%信頼区間とは
「(真値でなく)求められた誤差のある結果が100回中95回はその区間に入る、といえる区間」
という理解をしています。

>「100回中95回は真値を含む」
では、信頼区間はある一定の範囲で、真値は特定の値なのに
100回やってみると信頼区間の中に真値があるときもあればないときもある、
となってしまい、おかしいように思います。

私の理解でよいのなら、
「0%信頼区間」とは、
「何度値を求めても決してその区間内には入らない、という範囲」、
となるでしょうか。

Q散布図と折線の複合グラフが、散布図で折線が隠れてしまいます

エクセルで散布図と折線グラフの複合グラフを作ると、
散布図の線と折線の線が交差する時、散布図の線が上になり折線の線が隠れてしまいます
凡例も折線の系列が上で散布図の系列が下になっていて、系列の順序を入れ替え出来ません
エクセルの中でグラフの優先順位があるのでしょうか?

これを逆の折線の線が散布図の線を隠すように出来ないでしょうか?

Aベストアンサー

散布図と折れ線の場合は散布図が必ず上になるようで、第2軸にしても変わらないようです。
すべての系列を散布図だけで作成するか、または折れ線だけで作成することはできませんか

Q統計の検定と信頼区間について

統計学で検定,信頼区間について勉強しています。
参考書を読んで理解に努めているのですが,どうもよく分かりません。

<信頼区間>
http://dl.cybernet.co.jp/matlab/support/manual/r2007/toolbox/matlab/data_analysis/?/matlab/support/manual/r2007/toolbox/matlab/data_analysis/bqm3cio-1.shtml
上記リンクにおける2次多項式の信頼区間について,
信頼区間とは,データを発生した真の回帰式のパラメータに対して,
推定したパラメータがどれだけ信頼できる値であるかを示しているという
解釈でよろしいのでしょうか?


<検定>(http://case.f7.ems.okayama-u.ac.jp/statedu/hbw2-book/node9.html)
回帰における検定で,回帰係数の真の値がゼロでないかどうかを調べる
とあるのですが,なぜこれを調べるのでしょうか?
また,検定は上記の信頼区間の推定とどう関っているのでしょうか?

統計学で検定,信頼区間について勉強しています。
参考書を読んで理解に努めているのですが,どうもよく分かりません。

<信頼区間>
http://dl.cybernet.co.jp/matlab/support/manual/r2007/toolbox/matlab/data_analysis/?/matlab/support/manual/r2007/toolbox/matlab/data_analysis/bqm3cio-1.shtml
上記リンクにおける2次多項式の信頼区間について,
信頼区間とは,データを発生した真の回帰式のパラメータに対して,
推定したパラメータがどれだけ信頼できる値であるかを示しているという
解釈でよ...続きを読む

Aベストアンサー

#2です。
>> 信頼区間とは、その内側に真の値があると仮定した場合には、その帰無仮説が棄却されないような区間です。
> 信頼できる区間内に真の値があるということは,もともとの仮説を否定した仮説である帰無仮説は棄却されるのではないのですか?

「信頼区間の中に真の値がある」とする「帰無仮説」は棄却されません。実は、それが「信頼区間」の定義そのものだ、と言っても差支えがないでしょう。

検定することと、信頼区間を求めることは、兄弟のようなものです。検定は、1つの仮説を立てて、それが棄却されるかどうかだけを調べます。信頼区間を求める、ということは、無数に多くの仮説を検定して、どこを境目として検定結果が分かれるのかをさぐることと同じです。

実際には無数回の検定を実行するわけではありません。信頼区間を-∞から+∞までずっと眺めて行くと、多くの場合「棄却される域」~「棄却されない域」~「棄却される域」のサンドイッチ構造になります。この中央にある「棄却されない域」が「信頼区間」です。

Qエクセル、散布図でデータの一部のみの近似直線を書きたい

(1、5)、(2,8)、(3、16)、(4、25)、(5、37)というグラフをかきました。
ここでグラフのプロットは全てのデータについて表示されたままで、(3、16)、(4、25)、(5、37)だけについての近似直線を描き、式やR2値を表す方法は無いものでしょうか。
(1、5)、(2,8)というデータを消せば目的の式は得られるのですが、(1、5)、(2,8)というプロットをグラフに残したままにしたいのです。
どうぞよい知恵をお貸し下さい。

Aベストアンサー

1系列の一部のデータ範囲を対象に近似曲線を引くことは出来ないように思えます。便宜的な方法として以下が考えられます。お試しください。

■グラフの一部に近似曲線を追加する

全てのデータ範囲を選択する
|グラフウィザード 2/4 「グラフの元データ」|系列タブ|
系列1
 すでに全てのデータ範囲が対象となっている
系列2
 |追加|
 「Xの値」のボタンを押して後半のX値のセル範囲を選択する
 「Yの値」のボタンを押して後半のY値のセル範囲を選択する
グラフが作成される
全てのデータ範囲(系列1)と後半のデータ範囲(系列2)は重なっている
系列2へ近似曲線を追加する
 グラフ上、後半のデータ範囲の1要素を右クリック
 |近似曲線の追加|
 パターン・種類・オプションを指定する

■検討事項

・凡例・マーカー
無指定で系列に「系列1」・「系列2」という名前が付きます。同じ名前にすることは出来るようですが、系列2のみを消すことは出来ないようです。系列名の色を白にして見えなくする、プロットエリアのマーカーも二系列を同色とする、など考えられます。

・近似線
私は近似曲線のオプションに詳しくありませんが、全てのデータ範囲に対する近似線を引いたとして、後半のデータ範囲に対する近似線と重ならない(同形ではない)と思います。

1系列の一部のデータ範囲を対象に近似曲線を引くことは出来ないように思えます。便宜的な方法として以下が考えられます。お試しください。

■グラフの一部に近似曲線を追加する

全てのデータ範囲を選択する
|グラフウィザード 2/4 「グラフの元データ」|系列タブ|
系列1
 すでに全てのデータ範囲が対象となっている
系列2
 |追加|
 「Xの値」のボタンを押して後半のX値のセル範囲を選択する
 「Yの値」のボタンを押して後半のY値のセル範囲を選択する
グラフが作成される
全てのデ...続きを読む

Q信頼区間 正規分布しない場合

信頼区間を求める方法として、「標準正規分布では値が1.96以上の曲線下の面積と、-1.96以下の面積を合計すると0.05である。そこで平均から標準誤差SEに1.96の値をかけ算した値を引いた値と足した値の範囲に真の値が含まれるはずと言うことになる。これを95%信頼区間という」と本に記載されていました。母集団が少なく、正規分布していないであろうと思われるサンプルであっても、この方法に従い信頼区間を算出することは適切でしょうか?
具体的には以下の2群のそれぞれについて95%信頼区間を知りたいのです。
統計については素人なので的はずれな質問かも知れません。
X
209.1
280
91
124
80.57884211
67
152.2
88.584
138.0215385
112.43
115.71
97
128
144

Y
145.035
113.2352941
143.5
117.25
62
78
58
79.5
68.49975
73.85728571
81.61222222
190.5
58
179.25
84
76.6665
168.92
76.76

信頼区間を求める方法として、「標準正規分布では値が1.96以上の曲線下の面積と、-1.96以下の面積を合計すると0.05である。そこで平均から標準誤差SEに1.96の値をかけ算した値を引いた値と足した値の範囲に真の値が含まれるはずと言うことになる。これを95%信頼区間という」と本に記載されていました。母集団が少なく、正規分布していないであろうと思われるサンプルであっても、この方法に従い信頼区間を算出することは適切でしょうか?
具体的には以下の2群のそれぞれについて95%信頼区間を知りたいので...続きを読む

Aベストアンサー

通常用いられる区間推定法は、標本が正規分布に従うことを仮定していますので、#1さんの仰られている様に、標本が正規分布に従っていると見なせる場合しか使えません。
データのヒストグラムや統計的性質、そもそもの観測対象の性質を勘案して最適な標本分布のモデルを作り、両側5%点を計算することになるのでしょうか。

と言っても処方箋がないと困るでしょうから、私がこのデータをもらって信頼区間を推定せよ、と言われたらどうするか、という視点で以下私見を述べさせていただきます。

まずはヒストグラムを描いて、正規分布が当てはまりそうか目で確認します。統計的にきちんとやるなら、正規性の検定(#1の方の参考URLにある1標本Kolmogorov-Smilnov検定など)を行うのでしょうが、ここは簡便にいきます。
実際にヒストグラムを描くと(Excelで簡単に描けます)、ピークの右に裾を引いた非対称な分布になっており、正規分布は当てはまりそうにありません。
右裾の厚い非対称な分布の候補としては、対数正規分布やΓ-分布が代表的なので、これらを検討することになると思います。
特に、対数正規分布を仮定すれば、通常の区間推定法を使える(標本の対数を取って、それが正規分布に従うとすれば良い)ので、真先に検討することになるでしょう。
また一定値(50?)以下は取らないような標本にも思えますが、もしそうなら、その閾値を引いた値に対して、上記の分布を当てはめることになるでしょう。

以上です。
もっとも、これはあくまで与えられたデータだけに基づく考察であり、観測対象の理解とモデル化から始めるのが本来であろうと思います。観測対象の詳細が分かれば、より妥当なモデル化の方法があるかもしれません。

通常用いられる区間推定法は、標本が正規分布に従うことを仮定していますので、#1さんの仰られている様に、標本が正規分布に従っていると見なせる場合しか使えません。
データのヒストグラムや統計的性質、そもそもの観測対象の性質を勘案して最適な標本分布のモデルを作り、両側5%点を計算することになるのでしょうか。

と言っても処方箋がないと困るでしょうから、私がこのデータをもらって信頼区間を推定せよ、と言われたらどうするか、という視点で以下私見を述べさせていただきます。

まずはヒストグ...続きを読む

Qエクセルで散布図の上に相関関数の直線グラフを描きたい

エクセルを用いて、例えば平均気温とエアコンの普及率の関係を散布図のドットで表し、それに相関関数の直線グラフを重ねて描きたいときはどうしたらよいのでしょうか?
また、CORRELを使うと「0.568・・・」と数字がでてきますが、相関関数を「Y=aX+b」のように表したいのですが、a,bはどのように求めるのでしょう?

お願いいたします。

Aベストアンサー

Excel 97以降なら、

メニュー>グラフ>近似曲線の追加

――で可能かと。
詳しくは、ヘルプをどうぞ。

Q人口推計の信頼区間について

ある地域Aの人口を知りたい場合、すべての住民を1人1人数えるのは難しいため、地域Aを正方形の300区画に分けて、そのうちランダムに選んだ30区画の人口をそれぞれ数えたとします。1区画当たりの人口の平均が153人、95%信頼区間が(119, 159)の場合、これらのデータから地域Aの人口と信頼区間を求めるにはどうしたらよいでしょうか?

人口は153人/1区画×300区画=45,900人で良い気がしますが、信頼区間は(119×300, 159×300)=(35,700, 47,700)として良いのでしょうか?統計に詳しい方、教えていただければ助かります。よろしくお願いします。

Aベストアンサー

企業でSQCを推進する立場にあるものです。

これは、集落サンプリングという抽出方法で、
抽出2段目は全数抽出ですので、分散の補正は不要ですが、
抽出1段目は有限母集団修正を行わなければなりません。

95%信頼区間から、標準偏差を求め、分散に置き換えて修正します。

このぐらい高度な問題に取り組まれている方ですので、
上記のヒントで十分ですよね。

QExcelの散布図でプロットした任意の2点を直線で結びたいのですが

Excel2002での質問です。

X,Y座標系で数点の座標を散布図を使ってプロットしています。
このグラフの任意の2点を選んで引いた直線をグラフ上に表示したいのですが
方法がわかりません。
Excel使いのプロの方、よろしくお願いします。

Aベストアンサー

お求めになっている方法とは少し違い、サブ的な方法ですみません。

その任意の2点のx、yの組み合わせを、新たな系列で追加して、
2点間を結んでは駄目ですか?多分こういう方法はすでにお考えだと
思いますが、、、すみません。


人気Q&Aランキング