現在、統計解析を使って仕事をしているのですが、
手法の呼び名に関して疑問があります。
χ2乗検定などはもちろん「検定」だと思うのですが、
尤度比を求めたりするのは「解析」でしょうか。
そもそも、「検定」と「解析」の違いがよく分かりません。
教えていただけないでしょうか。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

統計には、データをすべて利用する統計と、一部しか利用できない(蛍光灯の寿命は、全ての蛍光灯の寿命を測定すると、商品が無くなる)推計がある、と考えています。


ある学校の一年生と二年生の身長の平均くらいだと、サンプル数が少ないので、平均値は簡単にも求まります。その場合、平均値には必ず差が出てきます。全ての数値を使っているので、この差は、誰が行っても同一です。
しかし、全国の一年生ともなると、数が多すぎるので、その中から無作為にデータを抽出します。無作為といっても、抽出は偶然に依存しますので、抽出した人によって結果の平均値は微妙に(場合によっては、かなり)違ってきます。そこで、その違いが偶然なのか否かを判定する必要が生じます。偶然だとは考えられない場合を、有意差があると表現して、差があると考えてもマアよいかな、ということになります。その判定法が検定法です。

解析は、「数値解析」に代表されるように、数値が変動するのは、必ず原因があります。その原因を明確にしようとするのが解析でしょう。
私の場合は、相関分析をすることによって、因果関係を明らかにしようとします。有意な相関が見られたからといって因果関係が成立するわけではないのですが、有意でなければ因果関係は無い、と断定できます。
有意な相関を見つけることが、因果関係の判定の第一歩だと考えています。
それでも、相関分析は、簡単にパソコンで出せることもあって、とんでもないものも多く見かけますが。

以上、私の考え方ですが、独善的な部分もあります。また、釈迦に説法の部分は、ご容赦を。
    • good
    • 1
この回答へのお礼

ありがとうございます。

まだよく分からない部分はありますが、
参考になりました。

お礼日時:2001/12/07 20:04

「検定」とは一定の基準のもとで検査して合否を決定することです。


「解析」は物事をこまかに解きわけ、組織的・理論的に研究することです。
簡単にいうと物事の決定には「検定」を行い、その内容について原因の「解析」を行う、といった様な使いかたでよいのではないでしょうか。
    • good
    • 0
この回答へのお礼

ありがとうございます。

ということは、χ2乗検定などの検定結果を用いて
「解析」をする、というような表現は合っているのでしょうか。

言葉って難しいですね。

お礼日時:2001/12/04 13:16

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qアクセス解析ソフトについて

ホームページのアクセス解析ソフトを選んでいるのですが、選ぶ基準が分かりません。どなたか、アクセス解析ソフトを評価しているサイト等がございましたら、教えていただけないでしょうか?


環境としては、LinaxのWebサーバーでログを取得し、解析するのは、Windowsパソコンでと思っています。
(本当は、サーバーに、アクセス解析ソフト自体をインストールすればよいのですが、使用しているWebサーバーは、レンタルサーバーの為、ソフトをインストールすることができないのです。その為、Webサーバーから一旦、Logをダウンロードし、Windowsパソコンで解析しようと思っています。)

Aベストアンサー

私も少し前に、自社サイトのアクセス解析を行うのにいろいろ調べておりました。

私も初めはサーバーにインストールするものを探していたのですが、調べ物をしていた時に、インストールするものやログを解析するものより、ASP型の方がより詳細な情報を解析できる、というようなことを解説したサイトを見つけ、ASP型に方向転換しました。(そのサイトは忘れてしまいましたが・・・)
kanntomiさんも、ASP型ソフトも検討されてはどうでしょうか?

ただ、リンク集はたくさん見つかるのですが、比較・評価をしたサイトは見つからず、このサイトで質問したところ期待していた以上のソフトを教えていただくことができたので、今はそれを利用しています。
(下記URL参照。無料サービスのサイトなのですが、有料版は非常に高機能です。)

ご参考まで。

参考URL:http://ax.ezbbs.net/

Q得られた曲線が有意かどうか検定?したい(統計学、χ二乗検定?、正規分布、データ解析)

あるデータをプロットしたところ、綺麗な曲線ではなく、ある箇所が台形みたいに出っ張り、歪んだ曲線になりました。

この歪みが、偶然ではなく、データの持つある傾向によって生じたことを証明したいです。

どうすればよいでしょうか?(調べると、χ二乗検定を使う?っぽいですが、よくわかりません)

簡単な手順や概要を教えていただけると幸いです。
抽象的な質問で申し訳ありません。よろしくお願い致します。

Aベストアンサー

単純には、データ群から「最もありそうな曲線」(直線とか、二次曲線とか、対数曲線とか)が引けたら、その曲線からの各データの「偏差」を計算し、そのデータ群の「標準偏差」を求めて、「ひずんだ箇所」がその「標準偏差」とどのような関係かを調べればよいと思います。(標準偏差を計算するときに、その「ゆがんだデータ」も含めるか、除外するかなどは、慎重に考える必要がありそうですが)
 つまり、「最もありそうな曲線」f(x) に対して、標準偏差をσとして
   f(x) ± σ とか f(x) ± 2σ  f(x) ± 3σ 
という「判定基準」を作り、「ひずんだ箇所」がこの範囲内に入るかどうかを見るということです。

 このとき、「偏差」を、単純な「最もありそうな曲線」との差(絶対値)とするのか、変数に依存した「重み」を付けるか(たとえば、そのときの変数の値で割って「%偏差」にするとか)といった、パラメータの特性を考慮した「工夫」も必要でしょう。
 いずれにせよ、その変数値をとる度数は、「最もありそうな曲線」を中心として正規分布する、という仮定での評価です。

 通常、「検定」では、分布曲線の両端の5%(一番上から2.5%、一番下から2.5%)の範囲に入ったら「明らかに異常」(統計的にそんな値は極めてまれである、有意な相違理由がある)とみなし、これはほぼ「標準偏差の2倍以上離れている」ということに相当します(検定で「有意水準95%」とすると1.96倍。「有意水準」が上の「明らかに異常」を何%にするかに相当)。
 これは「正規分布」の「平均値」と「標準偏差」の関係を用いて判断するということで、「検定」というのもこれと同じようなことしています。
 ↓正規分布
http://www.stat.go.jp/koukou/howto/process/p4_3_2_1.htm

 簡単には上のような判断ができますが、きちんとやるとすれば、データ群から「最もありそうな曲線」を求める「相関分析」と、その中での「外れ値」の検討をすることになるのだと思います。
 「エクセル」を使っても、いろいろなことができます。
http://www.ipc.shimane-u.ac.jp/food/kobayasi/biometry12_2010.html
http://software.ssri.co.jp/statweb2/column/column0909.html

単純には、データ群から「最もありそうな曲線」(直線とか、二次曲線とか、対数曲線とか)が引けたら、その曲線からの各データの「偏差」を計算し、そのデータ群の「標準偏差」を求めて、「ひずんだ箇所」がその「標準偏差」とどのような関係かを調べればよいと思います。(標準偏差を計算するときに、その「ゆがんだデータ」も含めるか、除外するかなどは、慎重に考える必要がありそうですが)
 つまり、「最もありそうな曲線」f(x) に対して、標準偏差をσとして
   f(x) ± σ とか f(x) ± 2σ  f(x) ± 3σ...続きを読む

Q暗号化ソフトを使っててもパスワード解析されるもの?

暗号化ソフトとしてフリーソフトAtchCaseを使おうかと思っています。

そこで疑問なのですが暗号化したファイルを解くパスワードは

同じくフリーソフトでダウンロードできるパスワード解析ソフトなどを

使って解析されてしまったりするものなのでしょうか?

それとも

パスワードも含め暗号化してあるのでパスワード解析されない、

またはされにくいということなのでしょうか?

ちょっとよくわからなくて質問させていただきました。よろしくお願いいたします。

Aベストアンサー

> 同じくフリーソフトでダウンロードできるパスワード解析ソフトなどを
> 使って解析されてしまったりするものなのでしょうか?

そういうパスワード解析ソフトというのは、普通はパスワードの総当りを行います。
解析される可能性はありますが、一般的には、それなりの時間(普通は年とかの単位)がかかります。

> パスワードも含め暗号化してあるのでパスワード解析されない、

暗号化したファイルにパスワードが格納されていて、そういうソフトでパスワードが抜き出されるとかって事は無いです。
そういう状態のファイルは、普通まともに暗号化されてるって言いません。

--
こちらは、10年以上前の記事ですが、

Internet Watch - 109ビットの楕円曲線暗号が解読される――RSAの600ビット以上に相当
http://internet.watch.impress.co.jp/www/article/2000/0414/109.htm

| 単体の450MHzマシンで解読する場合、解読に500年もかかるという。

って事ですが、最近のちょっといいPCなら、クロックで5倍、CPU数で4倍だとしても12.5年かかる計算とか。
複数台PCを使う、いわゆる分散処理なんかすると、もっと短い期間で解析できちゃう可能性はあります。
結局は、暗号強度とマシンパワーのいたちごっこです。


> フリーソフトAtchCaseを使おうかと思っています。

暗号化のアルゴリズム自体はそこそこ新しい物のようですし、強度もそこそこみたいですから、当面の実用には問題ないと思います。

> 同じくフリーソフトでダウンロードできるパスワード解析ソフトなどを
> 使って解析されてしまったりするものなのでしょうか?

そういうパスワード解析ソフトというのは、普通はパスワードの総当りを行います。
解析される可能性はありますが、一般的には、それなりの時間(普通は年とかの単位)がかかります。

> パスワードも含め暗号化してあるのでパスワード解析されない、

暗号化したファイルにパスワードが格納されていて、そういうソフトでパスワードが抜き出されるとかって事は無いです。
そういう状態の...続きを読む

Q統計解析、検定手法(Cochran-Mantel-Haenszel法)について

統計解析の素人なため、質問自体が根本的に問題かも知れませんが、
ご教授いただけますでしょうか。
-----------------------------------------------------
7年間の観察期間で、2群に分けて特定の検査を実施しました。
それらのデータを集計して算出した例数を用いて
それぞれ差を検定したいのですが、
Cochran-Mantel-Haenszel法が適していると聞きました。

ある部門で計算をしてもらい、結果を算出してもらいました。
漸近有意確率 (両側検定)にて、ある特定の検査項目のp値に
「*:p≦0.05」が出現したのですが、どのような説明ができるのか
教えていただけますでしょうか。

結果------------------------+
カイ2乗 5.621
自由度 1
漸近有意確率 (両側検定) 0.021
+----------------------------

質問方法と、情報の提示に問題があるかもしれませんが、
ご協力お願い申し上げます。

Aベストアンサー

簡単に結果から答えを言います。

「2群はある特定の検査項目に対して関係がある。」という答えになります。

※検査項目もある・なしとかの2群のはずです。

※自由度1のカイ2乗分布の5.621のところ(より左側)の面積が0.021です。

※「*:p≦0.05」有意水準のことで、0.05%以下の値なら帰無仮説=2群は独立である(関係ない)を棄却したことになります。
つまり、独立でない。関係がある。ということがいえます。

QELISPOTのための画像解析ソフト

ELISPOT用のプレートリーダーが製品として多々出ていますが、無料のスポット数解析用ソフトは存在していないのでしょうか?
どうにかお金をかけずに解析ができないものでしょうか?

フリーウェアを用いてする方法や、専用のフリーウェアの解析ソフトがありましたらどなたか教えてください。

Aベストアンサー

今日は。

確かに国内ではElispotをされている方がただでさえ少ないですから、需要と供給の関係上、リーダーユニットはかなりの高額ですね。

Elispotはカウントするだけで一苦労しますしね...
しかもソフトにドングルが付いて機器と一体型になってますからね。
かなり難しいのではないでしょうか。

ミネルヴァテック社では96穴プレート一枚当たり1万円で受託をされていますよ。

某社のリーダーはソフトにそこらで買えばたかだか数万円のスキャナーがついただけでウン百万円しますからね。
その代わりソフトで解析するとカウントから定量まで96サンプル2~3分で処理可能です。

Q尤度比検定についての質問です

尤度比検定についての質問です。次の質問のうちひとつでもよいのでおしえてください。
よろしくお願いします。

1.
3回実行したところエラーが2000個に2個、4000個に1個、6000個に5個みつかる装置Aと平均1000個に1個エラーが見つかる装置Bとを尤度比検定を使ってひかくする場合の式を教えてください。
2.
また、基本的な質問ですが、単に(2/2000+1/4000+5/6000)/3 と1/1000を比較するのに比べて、尤度比検定を使う利点は何でしょうか?
3.
また、比較する場合、小さい数において起こるエラーのサンプルをたくさん集めて行うのと、大きい数において起こるエラーのサンプルを前者より少ないサンプルで行うのとどちらがよりよい結果をだすことができるのでしょうか?
 

Aベストアンサー

あなたの方針を教えてください。
装置の何を比較するのか、何を標本とするのか、どんな仮説を検討するのか。

Q音楽ファイルから音符を解析するソフト

音楽ファイルを入力として、音楽ファイルのメロディの音符を解析するソフトはありませんか?
例えば、音楽ファイルを解析すると、ド、レ、ミ、ファ、...と解析される。

Aベストアンサー

譜面(MIDI)化したいならこちらあたり。
採譜の達人
http://www.pluto.dti.ne.jp/~araki/soft/st.html
がまぐち採譜
http://www.vector.co.jp/soft/win95/art/se039150.html

ほかの方も仰るように、訓練された人間の耳ほどにはうまく音階の解析はできません。
昔試してみましたが、使えるレベルではない、と判断しました。

採譜はできませんが、CDのリアルタイム解析だとこんなのがあります。
CD Player Plus!
http://www.vector.co.jp/soft/dl/win95/art/se121227.html

WAVE音源だとこちらである程度視覚的にわかります。
WaveIlluminator
http://www.vector.co.jp/magazine/softnews/060831/n0608313.html

こういったソフトを補助的に使って手入力した方が、まだましな採譜ができる気がします。

Q統計のχ2乗検定について教えてください

統計でχ2乗検定を行う際に、
χ2=n(ad-bc)2 /(a+b)(a+c)(b+d)(c+d)の式を用いると教わったんですが、
何故分子がn(ad-bc)の2乗になるのでしょうか?
マイナスになる場合があるからかと思うのですが、ならad-bcを使うのはどうしてですか?
この式は最後のまとめられた式かなと思うのですが途中の過程が分かるかたがいたら教えていただきたいです。お願いします。

Aベストアンサー

> この式は最後のまとめられた式かなと思うのですが

その式は2×2のクロス集計表で独立性の検定をするときに用い、ご明察の通りです。
Σ(観測値-期待値)^2/期待値
を変形していくとその式になります。

期待値はどう計算するのかと疑問に思われたら
http://okwave.jp/qa/q6311970.html
をご覧ください。

検定方法の分かりやすそうな説明は、以前カイ二乗検定の質問(http://oshiete.goo.ne.jp/qa/6981775.html )に回答したときに他の回答者が紹介された
http://oshiete.goo.ne.jp/qa/937856.html
も参考になるかと思います。

Qアクセス解析(無料ソフト)を紹介してください

HPに一日、何人訪れているか知りたいのです。
アクセス解析を毎日、チエックしたいのです。

アクセス解析(無料ソフト)をご紹介して下さい。
無料ソフトでも、どのキーワードからアクセスが来たの
かそこまでわかるのでしょうか?

いずれにしろ、無料ソフトのご紹介よろしくお願い致します。

Aベストアンサー

私はこれを使っています。とても良いです。


http://www.futomi.com/library/accs.html

Qχ2(カイ2乗)検定とフィッシャーの直接確率検定

統計学の素人です。
医学の臨床試験のデータに、p値についてχ2(カイ2乗)検定とフィッシャーの直接確率検定のふたつが記載してありました。
p値<0.05で有意差がある、と聞いていますが、上記のふたつの検定方法では、ともにp値<0.05で有意差あり、と考えてよいのでしょうか?
それとも検定方法によって異なるのでしょうか。
ネットで調べてみたのですが、難しくてわかりませんでした。
上記のふたつにつきまして、どのような値で有意差ありになるのか教えていただけますとたいへん助かります。よろしくお願いいたします。

Aベストアンサー

 サンプル数が多いときは、カイ2乗検定をして、有意差を算出する。
 サンプル数が少ないと有意差は出にくい(サンプル数が多いと、有意差は出やすい)ので、直接確率を算出するいうのが私の方針です。
 もっと平たく言えば、カイ2乗検定で駄目なら、直接確率による有意差に期待して危険率を計算しています(ほとんど期待はずれ)。

 有意差は、どの検定法でも、0.05未満で有意差ありと判定するのが一般的(原則)です。


人気Q&Aランキング