化学実験や物理実験では、同じ測定を3回繰り返してその平均値を使うことが多いのですが、この“3”という数字は統計的に意味のある数字なのですか?

このQ&Aに関連する最新のQ&A

A 回答 (10件)

訂正 :


No.9 は、たぶん早々に削除されることでしょう。

業界の慣習に沿って無難に処理するということは、
実務上必要でもあるし、考える労力の節約にもなります。
しかし、今回貴方がしたように「それは何故か」と
問うてみることは、物事を一段深いレベルで理解する
ための入口になるのです。
慣習だけで済まさないほうがよい。せっかく関心を持ったのだから。

私の回答は、統計上の一側面について書いてみました。
他にもイロイロの観点があろうかと思います。
自分の考え方が、見つかるとよいですね。
    • good
    • 8

最後のオチが「習慣に従え」じゃ、


数学カテゴリーとしては、ねぇ…
統計学の質問じゃ、ないの?
    • good
    • 12

#1です。


私の研究分野では学会の過去の研究論文や世界の先輩研究者の間で行われてきた標準的な実験データをとる為の試行回数が同じ実験条件に付き16回行ってその平均をとることが行われていましたので、それにしたがって膨大な試行回数の実験をおこなって、研究データを準備しました。
試行データ取得の繰り返し数は多ければ多いほど実験誤差の影響を取り除くことができます。実験には誰が行っても同じデータが得られるという再現性が求められます。そうでないと科学や研究とは言えません。

実験のやり方やデータの取り方や試行回数などは、その分野で認められた過去の実験データやデータ取得の試行数が過去の研究者の研究方法を元にほぼ決まっていることから、それに従えば、その分野の研究データとして学会や会社でも通用するデータになるかと思います。過去の実験方法や試行回数以上の実験を行ってデータを出すのであれば問題がないですが、業界や学会で確立している(常識となっている)実験条件や試行データ取得の繰り返し回数以下の実験データでは一般には通用しないと思います。単なるサボタージュ実験データとしか見做されないかと思います。

あなたのやっている実験についてはその分野で採用されている実験データの取り方(3回やって平均を取るなど)にしたがって、繰り返し回数を決めるといいでしょう。
先生も、そう言った実験データのとり方があなたの意図(できるだけ繰り返し回数を減らしたい)に対して、5回の平均を取るのがその分野の常識?となっていて、それを無視して繰り返し回数を減らす実験には、不安を感じておられるのかも知れません。
繰り返し回数は、統計的には回数が多い方が良いに決まっていますが、最低何回なら良いかという回数は、その分野で確立している(多くの研究者が認めている)過去の多くの人によって行われてきた実験データの取り方や回数を参考にすべきでしょうね。
そういった慣習を破るには、学会で多くの研究者や論文や業界に対して、それを覆すだけの理論的な根拠を示し、膨大な実験データを提示して実証し納得させないといけませんね。

その分野で最初に実験をしそのデータを研究論文等に投稿して受け入れられた場合、それが基になります。後続する同様な実験で多くの研究者が再現実験をしその実験方法や繰り返し回数で、不十分という実証データを提示して実験方法の変更などの提案がなされ多くの研究者に受入られれば、変更が加えられますが、そうで無い限り過去の実験方法が踏襲されます。
ですから、あなたの実験分野で行われている実験回数か、それ以上の回数の繰り返し実験を行うのが無難でしょう。先生も3回では不安に思っておられるのは、多分その分野では少なすぎで5回はやって平均をとるといったことにこだわって見えるのだと思います。

実験の難易度、費用、その他の条件がありますので、測定実験の繰り返し回数は、分野によって異なるのは当然ですね。回数は少ないよりは多い方がいいですね。でもその根拠は、過去のその分野の実験方法で多くの研究者で認められた妥当な回数によって決まるのでしょうね。
    • good
    • 5

 データを捨てることの可否は、何を調べるために何をどう測るか、ということに依るんじゃないですかね。

たとえば、ある物理実験を一度やると沢山のデータが出るけれども、それらのうちの最大値こそが測定結果だとします。この実験では、データ全体の分布は非常によく再現するんで、実験自体は安定している。けれどもまれに飛び抜けた最大値が現れることがあり、これは本来調べようとしている現象以外の外乱によるものと思われる(例えば背景放射線がたまたま飛び込んだとか)。で、この実験を様々な条件で行って、条件と測定結果との関係を調べることが目的である。…と、そういう状況では、どの条件でも丁度5回実験をやって、測定結果の最大と最小を捨てて残りを平均する、(あるいは中央値を採用する)というプロトコルを(恣意的でなく)常に行うと決めておくのは妥当かと思います。そうしないと、外乱の影響を強く受けて本来調べたい現象が見えなくなってしまうから。
 …と、これは余談でした。
 さて、ご質問の場合はANo.2のコメントに「空試験」とありますから、試験の対象は測定手段自体ですね。今後本番の測定を沢山行っていく予定であるが、その前に、測定手段がきちんと機能しているかどうか検証したい、という状況にあると思われます。
 空試験における測定結果のばらつきは、この測定系の持つ不安定さの反映だと考えられるでしょう。この系で異常値がどのぐらい現れやすいかを知っていないと、本番の測定で何回繰り返し測定をやれば良さそうなのか、目処も立たない。いや、本番でも同じ対象を繰り返し測ることが出来るのなら、何度も本番を経験する中でばらつきの傾向を見ながら繰り返し回数を減らしていこう、というアプローチもある。けれど、もし、測定に凄くコストが掛かったり、あるいは測定したらサンプルが破壊されて同じサンプルはもうない、という状況だったなら、そうはいかない。空試験をするなり、きちんと準備された標準サンプルを使うなり、要するに本来ならいつも同じ結果が出ると期待される測定を繰り返し行って、測定手段自体の試験をやっておくしかない。
 さてそういう状況において、「測定手段が原因となって異常値が確率pでランダムに発生する」という仮定を置くと、たとえば空試験を繰り返しても一度も異常値が出なかったなら、二項分布を使って(ある有意水準において)「pはある値以下だ」と推定できる。繰り返しを増やすほどpの上限値が小さくおさえられる。どのぐらいの上限値が欲しいかによって、繰り返し回数は決まる。なので、欲しい上限値がさほど小さくないのであれば、(ある有意水準において)

> 5回測定にメリットが無いことは統計学的に証明出来る

かも知れません。
    • good
    • 0

ロバストネスの基本事項を、少し補足しておきます。


3項目の中央値に情報量が少ないのは、
3項目の平均に情報量が少ないのと同じことです。
毎日3回づつ測定して10~30の値が続いていたデータに、
ある日50が出現すれば、誰もが「何か変だ」と思います。
だからといって、この50を恣意的に取り除いたら、
データを改竄したことになります。
代表値として平均値を採用していれば、
データは、この50の影響を受けます。
それは、よく言えば、データの変化に鋭敏だということ。
悪く言えば、誤差の混入に脆弱だということ。
その二つは、同じことの両面です。
中央値を採用していれば、
代表値は、50の影響を受けません。
中央値は、平均よりも、鈍感かつ頑堅です。たった3項目の場合にも。
    • good
    • 0

3という数に統計学上の意味はありません。

あらかじめ得られた情報と、精度上の必要性から来るものです。

先日、2人の医師に「眼圧」を測ってもらったところ、どちらも3回測って平均値をとっていました。それが医学上の常識とマッチするようです。

また、情報という観点からすると、
1回なら平均値
2回なら平均値・分散
3回なら平均値・分散・歪度
4回なら平均値・分散・歪度・尖度が計算できます(それぞれ1次・2次・3次・4次のモーメント)。
また、実験計画法によれば、8回の実験で、1個の平均と7個の要因の影響が得られます。
これらは、n個の方程式でn個の未知数が得られる、という理論と同じです。
もちろん精度の話は別です。精度を上げるには、多くの回数が必要です。
    • good
    • 1

>5回測定にメリットが無いことは統計学的に証明出来るのでしょうか?


統計学的に証明できるのであれば、統計学の教科書に「測定は、5回すること」と明記しているハズなので、質問をなさる余地はありません。

 以下、教科書は書かれていないことを述べます。
 統計学的に正しいことと、実利的に適切であることは、一致しない場合が少なくありません。というのも、統計学の基本は、両群に有意差あり、の結論を主張することしかできないことです。例えば、ガン患者の生存期間について、薬Aだと10±1、薬Bで11±2、という結果になったとします。これは、患者数(サンプル数)が少ないときは有意差無し、であっても、患者数を増やせば(理論的には無限に)有意差を認めることができます。
 有意差の判定には、単位は無関係です。現実的には、10年と11年と平均値に1年も差があれば、薬Bを選ぶでしょう。しかし、単位が秒なら、どうでしょうか。その1秒差のために、薬Bの値段が倍だったら。
 3回と5回の選択は、統計学ではなく、実利からの判断なのです。

 上司に「なぜ5回」と訊かれて、私以上の回答なら、尊敬して下さい。教科書にも書けないことをキチンと説明できるわけですから。
 3回だと、中央値を使えるというご意見は、賛成できません。3つの中央値、なんぞは信頼性が薄からです。なにより情報量が少ない。たとえば、10、20、30の場合、中央値は、20それだけです。ある日のデータが50になっても、そのデータについて、「おかしい」という判断はできません。平均±不偏標準偏差(σ)なら、20±10になり、51というデータがでれば、『3σより離れているので、何かおかしい」という結論を、統計学的に主張できます。
 平均値と中央値の使い分けも、教科書では不十分です。この相違は、統計学の基本中の基本なので、現場に合わせて使い分けができれば、統計学の初心者をようやく卒業でしょう。

 と偉そうに書きましたが、私も初心者で、流行の多重比較なんぞは分りません。
    • good
    • 0

> 5回測定にメリットが無いことは統計学的に証明出来るのでしょうか?



5回測定にメリットは、あります。
各測定の誤差間に相関がなければ (誤差に一定の傾向が無ければ、ということ)、
測定回数が増えれば増えるほど、測定値の分散(バラツキ)は小さくなる。
中心極限定理(大数の法則)というヤツです。

その意味では、測定は2回でもかまわないし、3,4,5,… と回数が増えれば
なお良い。費用対効果は、また別の話ですが。

3回という測定回数が特別なのは、中央値をとることができるデータ数の最小値
だからではないでしょうか。中央値、最頻値などの統計量は、「ロバスト」と
いわれ、大きな誤差を含むデータの混入に対して、平均値などより遥かに強い。

家庭用血圧計の使用説明書には、たいてい「3回測って中央値をとれ」と書いて
ありますね。

最後に平均値をとってしまうなら、3回という回数にこだわる意味は無いでしょう。
    • good
    • 1

 3回測定すれば、標準偏差が計算できます。

測定値は、正規分布をしていると想定できるので、測定値の範囲を推定できます。平均±標準偏差に68%のデータは入るからです。
 2回だと、標準偏差は、2つの測定値の半分、と自動的に決まってしまうので、ほとんど意味がありません。

 「繰り返して測定して平均値を出すのは何故」と学生に訊くと、「正確に測定するため」なんぞの安易な返事をしてくれます。それに対して「それなら、3回と言わず、5回、10回、100回と、無限に測定したら」と反論すると、まず答えられません。「何回もする暇はない」なんぞが学生から返ってきますが、「1回で済むところを、3回も測定するのは、暇そのものろう」と思います。
 救いようがないのは、検量線を3本引いて、その平均値を使え、なんぞ。検量線の方法を何も理解していない、からです。逆に1点検量なんぞの雑な記述も見ますが。
 一般的なサンプル(サンプルにばらつきが無い、あるいは微小)測定では、繰り返しは不要です。標準偏差は、単に測定者の腕の悪さを露呈しているすぎないからです。また、測定者の腕以外に、機器や器具の誤差もあり、これは防げません。もちろん、暇と金が余っているのなら、無限に測定するほど、真の値に近づきますが。

 逆に、動物実験のように、試料そのものに必ずバラつき(個体差)があるものは、最小でも3例必要です。
 また、測定法が技術的に困難で、バラつきが大きいもの(私は、5%を目安にしています)については、動物実験と同様、何度か測定を繰り返しています。

 私もたまに間違った回答をしてしまうことがあり、他の書き込みを批判したことはないと思うのですが、他の方の回答は、研究者として疑問を感じます、程度ではありません。どこの研究室か教えてほしいくらいです(本音は、こんな出鱈目な話は聞きたくもありませんが)。悪ふざけか、冗談でしょうか。それとも落とし穴。
 5回測定して、上下のデータを削り、残りの3つの平均、というのは間違いです。自分の都合の悪いデータを削除しているので、データの改竄そのもので、絶対に許されません。許されるとご判断されるのなら、学会で堂々とありのまま話して下さい。
 平均値ではありませんが、10匹マウスに化合物を投与して9匹には効いた。1匹死んだが、これは外れたデータなので削除、「この薬は、よく効く」なんぞが許されますか。
 許されるのは、試薬を入れ忘れたなどが確実で、サンプルが残っておらず、再測定ができない場合など、のみです。それでも、削除した理由を明示する必要があります。
 強いてあげると、5点で検量線を引き、『どうも1点外れている』の場合、その1点を外して検量線を引き直すのは、許されています。

 スケートなどの採点で上下を外すのは、恣意的な採点がありえるので、そのルールが明示されているからです。科学の世界では、測定値が恣意的に出されるわけではなく(と信じたいが)、改竄は許されていません。

この回答への補足

<それなら、3回と言わず、5回、10回、100回と、無限に測定したら?

私の知りたいのはズバリこれです!!私の上司は、空試験を5回しろと言います。3回では不安なのだそうです。この上司に5回測定の意味のなさを伝えたいのですが、5回測定にメリットが無いことは統計学的に証明出来るのでしょうか?
愚問でしたらすみません。

補足日時:2009/05/20 21:15
    • good
    • 1

2回の実験で異なる結果が出た場合、どちらがより正しい結果か分からないですね。

もう一回実験すれば、それによって、間違ったデータ(誤差の大きいデータ)の目安やデータのばらつきなどの判断に使えます。余程おかしなデータでなければ、3個の実験値のデータの平均で、誤差の影響を減らせるかと思います。
最低3回の測定は最低限ですね。
3回より5回、7回と行って、上下の一番外れたデータを除いて、残りの平均を取ることも行われます。
真値が分からない以上、測定誤差の影響をできるだけ少なくする為に平均を取るわけです。
最低3回だけでも、大きな測定誤差が入った場合の測定値を除外できます。
    • good
    • 1
この回答へのお礼

さっそくの解答、ありがとうございます!
私も、info22さんのように思っていました。この質問をした敬意は、上記(ひとつ上の回答の補足)のとおりです★

お礼日時:2009/05/22 11:57

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q統計学的に信頼できるサンプル数って?

統計の「と」の字も理解していない者ですが、
よく「統計学的に信頼できるサンプル数」っていいますよね。

あれって「この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる」という決まりがあるものなのでしょうか?
また、その標本数はどのように算定され、どのような評価基準をもって客観的に信頼できると判断できるのでしょうか?
たとえば、99人の専門家が信頼できると言い、1人がまだこの数では信頼できないと言った場合は信頼できるサンプル数と言えるのでしょうか?

わかりやすく教えていただけると幸いです。

Aベストアンサー

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要なサンプル数は、比べる検定手法により計算できるものもあります。
 最低限必要なサンプル数ということでは、例えば、ある集団から、ある条件で抽出したサンプルと、条件付けをしないで抽出したサンプル(比べるための基準となるサンプル)を比較するときに、そのサンプルの分布が正規分布(正規分布解説:身長を5cmきざみでグループ分けし、低いグループから順に並べたときに、日本人男子の身長なら170cm前後のグループの人数が最も多く、それよりも高い人のグループと低い人のグループの人数は、170cmのグループから離れるほど人数が減ってくるような集団の分布様式)でない分布形態で、しかし分布の形は双方とも同じような場合「Wilcoxon符号順位検定」という検定手法で検定することができますが、この検定手法は、サンプルデータに同じ値を含まずに最低6つのサンプル数が必要になります。それ以下では、いくらデータに差があるように見えても検定で差を検出できません。
 また、統計上差を出すのに必要なサンプル数の例では、A国とB国のそれぞれの成人男子の身長サンプルがともに正規分布、または正規分布と仮定した場合に「t検定」という検定手法で検定することができますが、このときにはその分布を差がないのにあると間違える確率と、差があるのにないと間違える確率の許容値を自分で決めた上で、そのサンプルの分布の値のばらつき具合から、計算して求めることができます。ただし、その計算は、現実に集めたそれぞれのサンプル間で生じた平均値の差や分布のばらつき具合(分散値)、どのくらいの程度で判定を間違える可能性がどこまで許されるかなどの条件から、サンプル間で差があると認められるために必要なサンプル数ですから、まったく同じデータを集めた場合でない限り、計算上算出された(差を出すために)必要なサンプル数だけサンプルデータを集めれば、差があると判定されます(すなわち、サンプルを無制限に集めることができれば、だいたい差が出るという判定となる)。よって、集めるサンプルの種類により、計算上出された(差を出すために)必要なサンプル数が現実的に妥当なものか、そうでないのかを、最終的には人間が判断することになります。

 具体的に例示してみましょう。
 ある集団からランダムに集めたデータが15,12,18,12,22,13,21,12,17,15,19、もう一方のデータが22,21,25,24,24,18,18,26,21,27,25としましょう。一見すると後者のほうが値が大きく、前者と差があるように見えます。そこで、差を検定するために、t検定を行います。結果として計算上差があり、前者と後者は計算上差がないのにあると間違えて判断する可能性の許容値(有意確率)何%の確率で差があるといえます。常識的に考えても、これだけのサンプル数で差があると計算されたのだから、差があると判断しても差し支えないだろうと判断できます。
 ちなみにこの場合の差が出るための必要サンプル数は、有意確率5%、検出力0.8とした場合に5.7299、つまりそれぞれの集団で6つ以上サンプルを集めれば、差を出せるのです。一方、サンプルが、15,12,18,12,21,20,21,25,24,19の集団と、22,21125,24,24,15,12,18,12,22の集団ではどうでしょう。有意確率5%で差があるとはいえない結果になります。この場合に、このサンプルの分布様式で拾い出して差を出すために必要なサンプル数は551.33となり、552個もサンプルを抽出しないと差が出ないことになります。この計算上の必要サンプル数がこのくらい調査しないといけないものならば、必要サンプル数以上のサンプルを集めて調べなければなりませんし、これだけの数を集める必要がない、もしくは集めることが困難な場合は差があるとはいえないという判断をすることになるかと思います。

 一方、支持率調査や視聴率調査などの場合、比べるべき基準の対象がありません。その場合は、サンプル数が少ないレベルで予備調査を行い、さらにもう少しサンプル数を増やして予備調査を行いを何回か繰り返し、それぞれの調査でサンプルの分布形やその他検討するべき指数を計算し、これ以上集計をとってもデータのばらつきや変化が許容範囲(小数点何桁レベルの誤差)に納まるようなサンプル数を算出していると考えます。テレビ視聴率調査は関東では300件のサンプル数程度と聞いていますが、調査会社ではサンプルのとり方がなるべく関東在住の家庭構成と年齢層、性別などの割合が同じになるように、また、サンプルをとる地域の人口分布が同じ割合になるようにサンプル抽出条件を整えた上で、ランダムに抽出しているため、数千万人いる関東の本当の視聴率を割合反映して出しているそうです。これはすでに必要サンプル数の割り出し方がノウハウとして知られていますが、未知の調査項目では必要サンプル数を導き出すためには試行錯誤で適切と判断できる数をひたすら調査するしかないかと思います。

> どのような評価基準をもって客観的に信頼できると判断・・・
 例えば、工場で作られるネジの直径などは、まったくばらつきなくぴったり想定した直径のネジを作ることはきわめて困難です。多少の大きさのばらつきが生じてしまいます。1mm違っても規格外品となります。工場では企画外品をなるべく出さないように、統計を取って、ネジの直径のばらつき具合を調べ、製造工程をチェックして、不良品の出る確率を下げようとします。しかし、製品をすべて調べるわけにはいきません。そこで、調べるのに最低限必要なサンプル数を調査と計算を重ねてチェックしていきます。
 一方、農場で生産されたネギの直径は、1mmくらいの差ならほぼ同じロットとして扱われます。また、農産物は年や品種の違いにより生育に差が出やすく、そもそも規格はネジに比べて相当ばらつき具合の許容範囲が広くなっています。ネジに対してネギのような検査を行っていたのでは信頼性が損なわれます。
 そもそも、統計学的検定は客観的判断基準の一指針ではあっても絶対的な評価になりません。あくまでも最終的に判断するのは人間であって、それも、サンプルの質や検証する精度によって、必要サンプルは変わるのです。

 あと、お礼の欄にあった専門家:統計学者とありましたが、統計学者が指摘できるのはあくまでもそのサンプルに対して適切な検定を使って正しい計算を行ったかだけで、たとえ適切な検定手法で導き出された結果であっても、それが妥当か否か判断することは難しいと思います。そのサンプルが、何を示し、何を解き明かし、何に利用されるかで信頼度は変化するからです。
 ただ、経験則上指標的なものはあります。正規分布を示すサンプルなら、20~30のサンプル数があれば検定上差し支えない(それ以下でも問題ない場合もある)とか、正規分布でないサンプルは最低6~8のサンプル数が必要とか、厳密さを要求される調査であれば50くらいのサンプル数が必要であろうとかです。でも、あくまでも指標です。

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要な...続きを読む

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Qn数?N数とはどのような意味ですか?

こんにちは。
よく、サンプルテスト等でn数?N数という言葉を聞くのですがどのような意味ですか?
テスト回数を意味するのでしょうか?

ご存知の方、教えてください。
宜しくお願い致します。

Aベストアンサー

[簡単な例]
りんごの重量を10個量ってみた
→n=10

nはnumberの頭文字です。

QJIS/ISO規格に基づくサンプル数の考え方・決め方

部品の温度上昇に関する試験依頼がありました。
サンプル数については依頼がありませんでしたが、
ISO規格、JIS規格等に基づく根拠を明確にして
説明することが求められています。

ISO規格、JIS規格に基づくサンプル数の決め方、計算方法、
根拠等についてアドバイスいただきますようお願い申しあげます。

Aベストアンサー

以下に詳細がありますのでご覧下さい。
http://homepage1.nifty.com/QCC/2003-3.html
http://aql.blog19.fc2.com/blog-entry-15.html

業務なら
「JIS Z 9015」そのものをご覧になられては
いかがでしょうか?

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む

Q測定したデータの誤差を計算する方法

集めたデータのばらつきを求めるときに使う計算法として、標準偏差がありますが、「誤差=平均値±標準偏差」と考えていいのでしょうか?
ほかに標準誤差というのがあるようなのですが、説明を読んでも何を意味している誤差なのか理解できません。
ちなみに、データは以下の通りです。

データ数:60
最高値:39.00
最低値:11.00
平均値:22.56
標準偏差:5.261
標準誤差:0.679(5.261/√60)
標準偏差を誤差と考えると22.56±5.261で、総データの70.0%が含まれます。
標準誤差を誤差と考えると22.56±0.679で、総データの10.0%が含まれます。

回答よろしくお願いします。

Aベストアンサー

ここで言う標準誤差は,平均値の確度を表す指標です.
(私自身は標準誤差という名称は初めてですが...)
なので母集団の平均の推定値は算出した平均値±α*標準誤差
(αは推定値の信頼度によって変化します.詳しくは
統計の教科書のt-分布のあたりをご覧下さい)

あと質問者さんは誤差を求めたいようですが,誤差の定義は
誤差=測定値-真値
であり,一般に真値は分からないので誤差は分からないことになります.
また何の誤差をお知りになりたいのかも不明です.上のデータが何をあらわしてるのかは不明ですが,
同一のものを60回測定した結果であれば,母集団の平均の推定値がほぼ真値を表しますので,誤差は,ほぼ標準偏差と考えることができるように思います.
一方60個の別のものを測定したとすれば,母集団の平均の推定値は母集団の平均値であり,標準偏差は60個のものの分布を表していることとなり,誤差という話はあまり出てきません.(無理に言えば,製造の誤差と言えなくもありませんが)

Q統計学でいうRSD%とは何ですか。

統計学でいうRSD%の平易な説明と計算方法を知りたいのですが。標準偏差はわかります。

Aベストアンサー

RSD%とは、相対標準偏差をパーセントで表示したものと思われます。

相対標準偏差(%)=(標準偏差/平均値)×100

次のページは、「相対標準偏差 RSD 平均値」で検索して出たものの一つです。
http://www.technosaurus.co.jp/product/mlh_faq_sd1.htm

参考URL:http://www.technosaurus.co.jp/product/mlh_faq_sd1.htm

Q繰り返し精度について

仮に全長が1.0mであれば直線運動するモノの繰り返し精度が±0.3mmとはどういう事でしょうか?0.3の誤差がでると解釈すれば良いのでしょうか?

Aベストアンサー

回答としては間違いではないですが・・・。
「繰り返し精度」とはある物体が元の位置から移動し
て停止する位置が、希望する停止位置に対してどのく
らい正確かと言う事です。
質問では1.0m移動するのか、1.0mの枠内で移
動するのかが分かりませんが、いずれにしても希望す
る停止位置に対して-0.3~+0.3mmの範囲で
停止すると言う事です。これは移動する物体が移動し
た先から元の位置に戻って来る時にもあてはまること
です。
工作機械や搬送機械にとっては重要な条件の一つです

Q標準偏差を求める際のデータ数について

統計初心者ですが、この度アンケート調査を行い、その結果報告書を作成しなければならないのですが、データ数9の場合、平均、最小、最大に加え、標準偏差も記載しようと思っていますが問題はないでしょうか?

標準偏差は、データが30、50以上ないと意味がないということを聞いたことがあるので戸惑っています。

また問題ない場合、「データ数が少ない場合は補正係数を掛ける」という説明を見かけたのですが、これは単に算出した標準偏差に補正係数を掛けて、記載すればいいのでしょうか? この場合の記載の仕方などについても教えていただけないでしょうか。

Aベストアンサー

標準偏差を求めることは,特に問題はありません。
ただ,データ数が少ないとばらつき具合が正しいかどうかの判断に困るというだけです。

補正係数については,条件によって変化する場合,例えばアンケートだと男女差や年代等による差異を軽減するためには使えますが,質問を見る限りは補正をする必要はないと思います。

標準偏差の意味を知る意味でも,正規分布について調べてみることをおすすめします。

Q工業製品の抜き取り検査のN数の決め方

実際に今起きている話ですが、例えばあるロットの一部を1箇所切り出して測定し、規格10以下に対して9であったため合格として納入したところ、客先で同じロットの別の場所からサンプリングし、検査した所、11であったらしく、このロットはNG扱いとなってしまいました。流出防止策として、安易な考えで”ロットの一部を1箇所切り出して測定し、8以上の場合は再サンプリングして判定する”としましたが、統計的に、再度サンプリングするための閾値の決め方やN数の決め方はどのようにすべきでしょうか?検査の工数増をできるだけ避けたいので、むやみやたらとN増しは行いたくなく、かといって仮に数十箇所測定して1箇所だけ規格外があっても、工場としては納品したいのが本音です。工場、客先双方が納得できる落としどころがあればよいのですが。

Aベストアンサー

今回の質問の前提条件を確認したいです.

抜き取り検査が許されているということは,普通は工程能力が十分あることが
確認されていると思います.そうでなければ抜き取り検査ではなく,全数検査する必要が
あるはずです.

今回の結果は「11」とは,規格上限に対して外れていたということでしょうか.
それとも規格上限には余裕があった上で,取り決めた数値に対して外れていたということ
でしょうか.(そうでなければ品質管理としては理屈がなっていないですが)

先ずはこの製品の工程能力がどんなものかそれがスタートです.



>仮に数十箇所測定して1箇所だけ規格外があっても、工場としては納品したいのが本音です

気持ち的には分かるところもありますが,こんなことを了解していては品質管理が分かっていない,
もしくは無視していることにしかならないと思いますが.


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング

おすすめ情報