こんばんは。
多変量解析と重回帰分析とクラスター分析について勉強したいのですが、素人でもわかりやすく解説したサイトと書籍をご存知の方、教えてください。

よろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

群馬大学の青木氏のサイトが充実しているのですか.「わかりやすい」かどうかは人の趣味の問題なので疑問です。



書籍としては.コロナ社の品質管理関係の厚さ0.5CMb5の本(書名忘却)が比較的「わかりやすい」(数式を使っていないという意味)で便利です。計算自体は今の世の中ですから.コンピューターで瞬時に出ますので.見方を重視するのであれば.こちらの本が良いかと思います。
    • good
    • 0

本やサイトだけでは理解するのが難しいでしょう。


やはり専門のセミナーを受講することをお勧めします。
私は会社の教育施設で行われる講座に行って覚えました。
「品質管理講座」「新QC七つ道具講座」「アドバンスド品質管理講座」などです。

私が知っているサイトは、原口正行さんのページです。

参考URL:http://isweb16.infoseek.co.jp/school/gucchi24/
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

QRでクラスター分析

Rでクラスター分析を行いたいですが、距離とそのノードが持つ特性の2つで
クラスター化してやりたいと考えています。

Rのクラスター分析では、もともと用意されている距離の尺度以外に
自分で導入した尺度でクラスター化してやることは可能でしょうか。

プログラミングの経験はありますが、Rのプログラミングには
まだ知識がありません。
よろしくお願いします。

Aベストアンサー

ご質問の意図は、
(1)各標本間の距離行列は与えられている(この場合はこのままRで解析可能)。
(2)これに加えて、自分で導入した尺度があり、変数が増えている。
ということですね。

(1)を算出した元となった変数行列はありますか。
それがあれば、自分の変数を加えて、再度「dist」で距離行列を
算出し直して、「hclust」でクラスター分析をすればよいです。

具体的なスクリプトが必要な時は、データの一部をアップして下さい。

元の変数行列が無い時は、ちょっとアイディアが浮かびません。

Q業務分析の手法

工場の現場の業務分析および改善をすることになりました。
といっても何から始めてよいのかわからず、戸惑っている状況です。

どのように進めていけばよいのか、その際に利用する手法などを教えていただけないでしょうか。また参考になるHPや参考書などがあれば教えていただけると有難いです。

大雑把な質問ですみませんが、よろしくお願いします。

Aベストアンサー

追加です。
PQCDSMの代表的な指標のリストを挙げておきます。

P(生産性) 1人当た付加価値生産性、突然故障件数、故障度数率、故障強度率、MTBF(平均故障間隔)、MTTR(平均修復時間)、設備移働率、チョコ停発生回数、設備総合効率
Q(品 質) 工程不良率、客先クレーム件数またはクレーム金額、不良損失金額
C(コスト) 製造原価率、保全費
D(納 期) 納期遅延件数、納期遅延率、製品・仕掛り品在庫量、リードタイム、生産計画達成率。
S(安全性) 休業災害・不休業災害件数、災害強度率
M(意 欲) 1人月平均改善提案件数、QCサークル(小集団)活動数回数、ワンポイント・レッスン作成枚数、保全道場修了者数

また、改善の手法として「改善のECRS」が使われることがありますが、これは今回紹介したやり方ではマトリックスの中に入れる項目として使われることがあります。

改善のECRS
E・・・排除
C・・・結合
R・・・交換
S・・・簡素化

Qクラスター分析の切断面

初歩的な質問ですみません。
1.クラスター分析の切断面は結合距離の1箇所で切らないといけないのでしょうか?
ある人の文献では、1箇所の結合距離で切ってクラスター群を分けたり、
またある人は2箇所で切ってクラスター群を分けていました。
2.切断する場所はその人の主観で決めているのでしょうか?
3.同一の調査を行なった、2つの樹状図の切断面は同じ距離で切らないといけないのでしょうか?
なにぶん素人なので分かりやすくお願いします。

Aベストアンサー

Selferです.補足説明拝見しました.

>A,B,C,D,E,F,G,Hの8系統で、
>系統AとBが結合距離1で結合、系統CとDが2で結合、(A,B)と(C,D)が3で結合、
>(A,B,C,D)とEが5で結合、FとGが4で結合、(A,B,C,D,E)と(F,G)が6で結合、
>(A,B,C,D,E,F,G)とHが7で結合、

距離1(A,B)(C)(D)(E)(F)(G)(H)
距離2(A,B)(C,D)(E)(F)(G)(H)
距離3(A,B,C,D)(E)(F)(G)(H)
距離4(A,B,C,D)(E)(F,G)(H)
距離5(A,B,C,D,E)(F,G)(H)
距離6(A,B,C,D,E,F,G)(H)
距離7(A,B,C,D,E,F,G,H)

こういうことでしょうか?

>この図で先輩は(A,B),(C,D),(E),(F,G),(H)の5群に分類してました。

ふむ.確かに先輩の方の分類は上記のどの距離段階にも対応していませんね.
敢えて言えば,ひとまず「距離4:(A,B,C,D)(E)(F,G)(H)」を採用して,そこに補足的に「(A,B)(C,D)」という群分けを組み込んだのですか……

クラスター分析は基本的に一つの切断面で判断をするのが通常の使い方なので,結果至上主義ならば,確かにこの恣意的な分類に対しては反論がでると思います.
ただし,前回でも回答したようにクラスター分析は「最適な分類基準を見付けるための一つの方略」なので,もっと言えば,クラスター分析の結果を参考にして,新たな判断基準を……先輩がされたような補足組み込み的な分類基準を考案されるのも一つの方法だと思われます.

それよりも「その群分け基準」が有効かどうか,が問題となります.ある研究のデータをクラスター分析することである「群分け基準」が提供されたとします.しかしこの基準が良いかどうかは,「その群分け基準を使うことによって別の研究結果の説明効力が高い」ということによって検証されるものです.その時に,クラスター分析のコンピュータ計算結果をそのまま信じた判断基準が有効でなかったのならばその分類基準は良くないものであり,多少恣意的な判断基準であっても,その基準の方が説明効力が高いのであれば,その恣意的な判断でも別に構わないと思います.

この辺になると,クラスター分析などデータ解析法の結果を率直に信じるタイプと,それらはあくまでも(大いに有効であるが)参考資料でしかないというタイプ,いずれのタイプによって意見は分かれると思います.
統計学者のフィッシャーは統計法の結果はあくまでも判断基準の一つであるとして後者の立場を,フィッシャーの後継者であるノイマン&ピアソンなどは前者の立場であり,どちらの意見が正しいか,とは一概には言えないでしょう.

データ解析法を道具的に使用される研究者(統計学が専門ではない研究者)であるならば,ある程度恣意的であっても,【妥当性・信頼性の高い仮説に適合させるならば,データ解析結果は非常に有効な判断資料ではあるが,結果をそのまま鵜呑みにしない方がいいのではないのか】,というのが個人的な意見です.

要するに,恣意的な群分けを採用されるのならば,それなりの説得力がある意見を添えておかないと,他者からの反論に対応するのがきついぞということです.

Selferです.補足説明拝見しました.

>A,B,C,D,E,F,G,Hの8系統で、
>系統AとBが結合距離1で結合、系統CとDが2で結合、(A,B)と(C,D)が3で結合、
>(A,B,C,D)とEが5で結合、FとGが4で結合、(A,B,C,D,E)と(F,G)が6で結合、
>(A,B,C,D,E,F,G)とHが7で結合、

距離1(A,B)(C)(D)(E)(F)(G)(H)
距離2(A,B)(C,D)(E)(F)(G)(H)
距離3(A,B,C,D)(E)(F)(G)(H)
距離4(A,B,C,D)(E)(F,G)(H)
距離5(A,B,C,D,E)(F,G)(H)
距離6(A,B,C,D,E,F,G)(H)
距離7(A,B,C,D,E,F,G,H)

こういうことでしょうか?

>この図で先...続きを読む

QVRIO分析って?

企業の経営資源の分析方法として、価値・希少性・模倣可能性・組織という観点からのVRIO分析というものがあるという事を知りました。一般的に、SWOT分析はスウォット分析と言いますが、VRIO分析はなんと読むのでしょう?

Aベストアンサー

そのままヴリオと言っていますが。ちなみに(関係ないですが)同じ綴りの
企業が実在し、それはヴェリオと呼ぶらしいです。

Qクラスター分析でのクラスター数について

クラスター分析の初心者です。クラスター数をどうするか、何個に分類するか迷っています。これまでの質問をみていると主観的に分けたらいいと書かれていますが、なにか統計的に示したいと考えています。
 そこであるHPからBealeのF値のやり方が載ってました。これを用いたいと思うのですがうまくいきません。すいませんが詳しい方教えてください。そのHPには、

BealeのF値(Beale’s Pseudo F statistic)
2つのクラスター結果C1とC2(クラスター数はそれぞれc1,c2でc1>c2)があったとする。W1、W2をそれぞれのクラスター内のクラスター平均からの偏差平方和とすると、ビールのF値は、F*=(W2-W1)(n-c1)k1/W1[(n-c2)k2-(n-c1)k1]で定義される。ただし、n=全個体数、k1=c1-2/p、k2=c2-2/p、p=変数の数
F*>FcritならばC1を採択。FcritはF(k2(n-c2)-k1(nc1),k1(n-c1))のF分布の(例えば)5%点。

http://okabe.t.u-tokyo.ac.jp/okabelab/asami/clustering.pdf

このように書かれていました。わからない点は、W1,W2の求め方です。
 私の考えでは、W1において分かれている個々のクラスター内で変数毎に平均値を求め、それを用いて変数毎にクラスター間で偏差平方和をして、変数分合計を出すと考えています。そうすると私がしたクラスター分析ではF値がマイナスになってしまいます。この考え方は間違っているのでしょうか?
 分析対象は、個体数22、変数100となっています。

クラスター分析の初心者です。クラスター数をどうするか、何個に分類するか迷っています。これまでの質問をみていると主観的に分けたらいいと書かれていますが、なにか統計的に示したいと考えています。
 そこであるHPからBealeのF値のやり方が載ってました。これを用いたいと思うのですがうまくいきません。すいませんが詳しい方教えてください。そのHPには、

BealeのF値(Beale’s Pseudo F statistic)
2つのクラスター結果C1とC2(クラスター数はそれぞれc1,c2でc1>c2)があったとする。W1、W2をそれぞ...続きを読む

Aベストアンサー

> どのように考えたらいいのでしょうか?

先の回答そのままです。
クラスター k に属する個体 Xi(k), i=1,…,22 とクラスター k の重心 m(k)がそれぞれ100次元のベクトルになりますから、その差のノルム || Xi(k) - m(k) || (ユークリッド距離に相当)が偏差になりますので、偏差の2乗 || Xi(k) - m(k) ||^2 を全ての i について和をとればいいのではないかと思います。文字通り偏差平方和です。具体的な計算はベクトルの成分を書いてみれば解るかと思います。

Q素人からのコンサルタントの可能性

コンサル職歴なし,システム・経営・営業・人事の職歴もなしですが,コンサルタントとして漠然とした憧れだけは持っています。現実として厳しいのは承知ですが,30歳過ぎてから,例え雇われであっても,1から経営または人事のコンサルタントとして自分の給与程度は稼いでいける可能性はどのくらいだと思いますか?またそれは,男女で違うものでしょうか?

Aベストアンサー

yazuyaさんには少なからずきつい話になりますが、対価を頂戴できるコンサルタントとしておやりになるのであれば次のような要件を備えてなければやってゆけません。
これがコンサルティングビジネスをやってゆく上での現実です。

*専門性
 どのような領域でもよいのですが、クライアントから投げられる課題・問題に対して解決出来るだけの専門性を持つことです。
 その領域の経験があればよりベターですが、保有する知識だけで解決へ導く提案が出来る程度でも当初の間はやってゆけます。

*求められる能力
 この点については、既に私が回答した内容がありますので、このサイトの カテゴリー一覧>ビジネス&キャリア>コンサルティング>質問番号No485「女性コンサルタントの方へ」教えてください に対する回答ANo#3を参照してください。

いずれにしましても、文面から拝見する今のままでは無理でしょう。今後のチャレンジに期待いたします。頑張ってください。

Qクラスター分析について

はじめまして。
クラスター分析について最近勉強を始めたところです。似たもの同士をくっつけていくというイメージはできましたが、類似度の測定方法やクラスターの合併方法がたくさんありすぎて困っています。そこで、
(1)どうゆう時にどの方法を使うのが効果的なのか?
(2)各測定方法、合併方法を使う時の利点と弊害は?
以上2点についてやさしく教えて下さい。
また、詳しく分かりやすく説明してある文献があれば
紹介して下さい。
よろしくお願い致します。

Aベストアンサー

自信はありませんが,手持ちの資料を参考にいくつかアドバイスをしたいと思います.浅学なため間違いがあるかもしれませんので,その点御了承下さい.

クラスター分析には実に様々な手法が用意されています.

(1)階層的/非階層的
(2)距離(類似性)の算出法
(3)結合(合併)の方法

この三ポイントでどの手法を用いるかが別れていきます.クラスター分析はオプションが様々あり,分析する人もちゃんと理解して使っている人というのはあまりいないのでは? と個人的に思います.

(1)階層的/非階層的
少なくともこの違いだけは押さえたい基準です.クラスター分析は樹形図を描く……これが一般的な連想だと思いますが,あのような,階層的な図である樹形図を求めるのは,階層的クラスター分析です.非階層的クラスター分析は分析者が予め何個のクラスターにデータを分類するか,を指定して分類させる手法のことです.非階層的クラスターでは樹形図は描かれません.
類似性の過程を見たい,あるいは自分でクラスターを分類したいのならば階層的を,とにかくコンピュータに分類させるのであれば非階層的な手法を選びます.

(2)距離(類似性)の算出法
有名な統計ソフトにSASとSPSSがあります.SPSSはこの分類を簡単に選択できますが,SASではこの距離算出は選べない……はずです(最新版ならばあるいはできるのかもしれませんが).また,使用する統計ソフトによって選択可能な距離法が違います.
一般的な距離選択法はユークリッド距離法でしょう.恐らくデフォルトはこれが多く,最も制限が少ない汎用性が高いものと思われます.この距離算出法の使い分けを勉強しようとすると,難しい専門書に手を出さなければなりません((1)と(3)の説明を簡単にといえども説明している比較的入門的な統計学の教科書はありますが,この(2)の解説をしたものは入門書では見たことはありません).
ただし,使い分けるための基準としては,そのデータが名義/順序/間隔/比率尺度のどれか,の観点で分けられます.例えば相関係数を利用する距離算出法がありますが,相関係数は間隔×間隔尺度データで算出可能な統計値であるので,名義尺度や順序尺度データには使うことはできません.このような観点から距離法を勉強されると良いと思います.使い分けに自信が出るまではデフォルトのユークリッド距離法を使われるが良いでしょう.

(3)結合(合併)の方法
主要なものに最近接法,最遠隣法,群平均法,重心法,ウォード法が挙げられます.解説書を見ると,数学的な意味算出法は説明されてはいます.例えば,最近接法はクラスター内の最も近い点同士の距離を参考に,最遠隣法は逆に遠いものを,群平均法は近い距離と遠い距離との平均を,重心法はユークリッド距離が保証されているときに重心を求めてその距離を算出などなど書かれています.
残念ながら,どのときにはどの手法が有効か……というHow to的なものを解説してくれているものはほとんどありません.一応手持ちの資料には

・最近接法:結果として鎖状の大きなクラスターができやすい
・最遠隣法:サイズのほぼ等しいクラスターができやすい
・ウォード法:各クラスター内の分散の残差が最も小さくなるようにする.

とあり,「どの手法を用いてもそのアルゴリズム内において最良のクラスターが得られるようになっている」とも書かれています(その他の結合法の特徴は触れられていません).
なお,結合法の中では,分散に注目したウォード法が優れれているといわれています.

クラスター分析は,その他の多変量解析(重回帰分析など)とはその考えが違います.その他の多変量解析とは,その結果は正しいかどうかを判定するものが多いです.これは逆に言えば,正しい結果があるものだ,と考えているわけです.しかしクラスター分析は,そもそも「正しい」結果なんて一概には決められるものではない,分析者が考える結果を考えるための材料を提供するものだ,という精神に則っています.

これに関連して,データ解析の基本的な立場について二三思う所を述べます.データ解析法では,大きく二つの立場があると思います.選択肢が限定されている非常に固定されたものと,非常に開放的で選択肢が豊富(その代わりに一概に「正解」を導けない).
質問者さんの御存知の通り,クラスター分析とは「似たもの同士をくっつける」解析法です.これまでの,その他の分析法では「『似たもの』というのは,素人にはその正確な定義はよくわからなくとも専門家の間では一致してはっきり○○だ,と共通の意味を持っているに違いない」と明確に「似たもの」が定義されていると考えるところです.この考えは,先の「固定的立場」です.
しかしクラスター分析では,「『似たもの』にもいろいろ意味があるよ.あなたはどの意味で『似る』って考える? 色々あるからその中で自分の考えに適したものを選んでね.『くっつける』っていろいろ結合の仕方はあるよ.そのうち,あなたの考えている『くっつける』ってどれ? いろいろな中から選んでよ」と分析者に選択を任すようになっています.これは「開放的立場」です.
クラスター分析がもしも伝統的な「固定的立場」から作られたとすると,例えば「『似る』や『くっつける』とは色々あるだろうが△△に意味を限定するぞ! え? その意味に納得できない? しらん.その意味に納得できないなら,この解析法を使うな」となるかもしれません.

この意味からすると,クラスター分析のオプションの選択には「利点や弊害」というものはないと思います.例えば,最近接法では「大きなクラスターができやすい」とあります.これが何か問題があるのでしょうか? もし「サイズのほぼ等しいクラスターを作りたい」と分析者が考えていれば,これは「弊害」になるかもしれません.でも,最近接法の基準でいえば,自分の基準内で理想的なクラスターを作成しているだけで,利点も弊害もありません.
こう考えるとクラスター分析では「効果的」という考えも不適で,「そもそも分析者はどんなクラスターができれば理想なの?」と大本に立ち戻る必要があると思います.

そういうわけで,実際問題としては,あまり数学的な意味をあれこれ押さえるよりも,実際に統計ソフトで分析させみて,実際にどのような結果になるのか,を見て判断するのが一番「効果的」だと思います.

……と書きながらも,私自身も,どの合併法ではどのような特徴があるのかを知りたい,という微妙な気持ちを持っているのですが……

参考資料
「Q&Aで知る統計データ解析」サイエンス社(ISBN4-7819-0915-9)
「初心者がらくらく読める多変量解析の実践」現代数学社(ISBN4-7687-0212-0)

自信はありませんが,手持ちの資料を参考にいくつかアドバイスをしたいと思います.浅学なため間違いがあるかもしれませんので,その点御了承下さい.

クラスター分析には実に様々な手法が用意されています.

(1)階層的/非階層的
(2)距離(類似性)の算出法
(3)結合(合併)の方法

この三ポイントでどの手法を用いるかが別れていきます.クラスター分析はオプションが様々あり,分析する人もちゃんと理解して使っている人というのはあまりいないのでは? と個人的に思います.

(1)階層的/非階層...続きを読む

QABC分析とABMについて

当社は、金融機関のバックオフィス専門のサービスをしている会社で従業員は1500人程度の規模です。
ABC分析を行うことになり、にわかに勉強を始めたばかりなのですが、その有用性に疑いを感じています。分析を行うための、データを集積するためのシステム開発に莫大な予算を要するからです。
確かに考え方そのものは、興味深いもので大いに参考にすべき点はあるものの、経営陣に分析結果から考察を行う意欲を感じないからです。データ採取を担当する現場の負担を考慮しても、定着は厳しいものがあると感じます。
ABCやABMはどんな規模の組織についても、有効なのでしょうか?
また、質問の内容が変わりますが、この場合のシステム開発とかもろもろの費用として「かけても良い金額」とは、どの程度でしょうか?売上金に対する比率など、一般的にはどの程度なのでしょう?
当社の資本金は二億円。すでに、開発費を一億円程度使ってしまったようです。

Aベストアンサー

ABC分析は利潤を求めるほとんどの場合に有効だと思います。規模は大きいほど有利ですが、あまり大きすぎる場合は何らかの切り口で分割しないと机上の理論で終わってしまうのではないかと思います。

通常は、蓄積された生データをもとに分析しますが、生データの項目が乏しい場合はいくつかの項目を追加し保存できるように修正します。また、大規模なシステム変更が必要な場合は、システムの刷新などのタイミングまで待つこともあるでしょう。
つまり、業務をまわしていくと自然と蓄積されるデータを使用することになります。

ご質問からは、まったく新たにシステムから構築していくようなので、採算ラインに至るには相当の時間とマンパワーが必要になるでしょう。
経営陣にその意欲も感じられないことから、非常に厳しいと思います。既に一億円が投じてありますが、最終的な稼動までのコストを見積もって、そのコストの範囲でできる他のことと比較して今後の方針を決めるとよいと思います。

Qクラスター分析法を詳しく教えてください。

spssを使ってクラスター分析法で解析を行いたいのですが、spssを使うのが始めてで、どのようにやれば良いか、困ってます。これから自分でも調べてみますが、もし何か参考になる本やHP等があれば、教えていただきたいです。また簡単な説明などしていただけたら幸いです。よろしくお願いします。

Aベストアンサー

クラスター分析ならば.統計一般の説明のアドレスをお知らせします。

本は.行方不明なので図書館で探してください
にっかぎれん 多変量解析 著者名忘却

参考URL:http://oscar.lang.nagoya-u.ac.jp/ref/statistics.html

Q経営分析のケースについて

経営コンサルタントとしてのスキル向上を目的として、仲間数人と企業のケーススタディによる勉強会をやりたいと考えています。そこで経営分析を行うためのケースを探しています。無料もしくは格安で活用できるケース(企業概要、経営課題、財務諸表等がまとめられたもの)が公開されているのをご存知ではないでしょうか?よろしくお願いいたします。

Aベストアンサー

ケーススタディであれば、資料として用いるべきものは有価証券報告書です。つぎのサイトには、有価証券報告書が公開されていて、無料で入手する事ができます。

EDINET
http://www.fsa.go.jp/edinet/edinet.html
宝印刷
http://www.hello-ir-world.com/
亜細亜証券印刷
http://www.aspir.co.jp/

また、決算短信であれば自社のサイトに載せている会社が多く見られます。


人気Q&Aランキング

おすすめ情報