初めて投稿させていただきます。

評価情報(口コミ)に関するアンケート調査を行いました。
アンケートについては、男女別の年代ごとに調査しました。質問数は20問程度あり、その結果を男女別の年代ごとに、単位をパーセントとして集計しました。
この集計したデータと男女別、年代別の相関関係を知りたいと思っています。そのため、有効な解析手法を教えていただきたいです。

統計に関して、ただいま勉強中で大変申し訳ありませんが、回答いただけると幸いです。よろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

 カイ2乗検定は、有りと無しの2群のみで検定しますが、回帰分析は、その程度でも解析できます。

煙草と肺がんの関係なら、カイ2乗検定では、喫煙と非喫煙の2グループのみ。毎日1本の人と40本の人は、影響が違うハズ。回帰分析では、煙草の本数でグループ分けをして、喫煙本数から肺がんによる死亡率を推算することが可能です。

 ここで、回帰分析と相関分析は、ソフトを使えば同時に可能なので、あまり区別されていません。持論は、回帰式を出すのが回帰分析、相関係数を算出するのが相関分析です。

>評価情報の参考度と購買の関係は相関関係になっているのでしょうか
ブランド品は、まさにブランドという評価だけで売れるので、売上とは相関はあるハズ。
 購入者の情報量と売上を相関分析すればよい。と簡単に書きましたが、情報量をどのように数値化するのが難しい。
 あとは、散布図を描いて、直線が描きやすければよい。回帰分析と相関の全てを書くと、かなりの枚数がいるので、本を見てください。エクセルには、散布図もあれば、回帰式(近似式となっている)、相関係数(R-2すなわち決定係数を表示できるので、その平方根)も表示できるので、計算などはパソコン任せにできます。

 相関分析が難しいのは、ここから。というのも、相関が有意であっても、実際には見かけの関係、が多いのです。専門家でも間違っています。
 相関分析では、因果関係の有無の判定をします。無い場合を擬相関といいます。たとえば、世界各国の新聞の発行部数と平均寿命の関係。新聞の発行部数の多い国になるほど寿命が長い。すると、長生きするには、新聞を読めば良い、という結論が可能です。新聞を読むと、健康に関する知識が得られるので長生きがする、ともっともらしい説明も可能です。しかし、新聞を読むだけで長生きできるのなら、栄養も医者も要りません。これは擬相関の例です。

>その関係の分析手法を教えていただきたいです。
手前味噌ですが、エクセルの実際は下記に。Office2007だと、ボタンなどはどこかにあるハズなので、捜して下さい。
http://oshiete1.goo.ne.jp/qa3516234.html

参考URL:http://oshiete1.goo.ne.jp/qa3516234.html
    • good
    • 0
この回答へのお礼

お忙しい中、回答ありがとうございます。
大変勉強になりました。
相関があっても、因果関係がなければいけないことなど、わかりやすい内容で大変助かりました。
ありがとうございました。

お礼日時:2008/11/18 16:01

>ただいま勉強中で


教科書的なもので勉強されているのなら、最初の方に、「データを取る前に、統計処理の方法を考えてから」と明記してあるハズ。明記していないのなら、そんなものは捨てること。

>男女別、年代別の相関関係
相関というのなら、何かと何かの関係です。なさりたいのは、関係ではなく、男女で差があるのか、ということかと。これは相関ではなく、検定です。カイ2乗検定がつかえるかも。というのも、アンケートの質問に対する回答方法によります。カイ2乗検定など、検定がができるように、アンケートをとるのが常識。
 年代と関係があるのか、なら相関も使えます。肺がんによる死亡率は、喫煙開始の年代が高い、なんぞを示すことができます。グラフを探して、真似して下さい。

 多くのアンケートは、回答をダラダラ書いているだけなので、あらかじめ検定法を設定していないのであれば、そんなものでしょう。

この回答への補足

お忙しい中、早々の回答ありがとうございます。
早速、カイ2乗検定について勉強したいと思います。

相関についてですが、評価情報の参考度と購買の関係は相関関係になっているのでしょうか?また、その関係の分析手法を教えていただきたいです。

いろいろ質問してすみません。よろしくお願いします。

補足日時:2008/11/18 03:05
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q統計学関連の資格

 統計学の知識や技術を評価されるような資格はありますか?自分で資格ガイドの本を買って調べてみたのですが、それらしきものを見つけることができませんでした。ご存知の方は教えてください。

Aベストアンサー

なくはないんですけどね。よく雑誌の広告などにある「統計士」になる通信教育講座とか。
実態がはっきりしませんので、おすすめはしませんが。

統計学を生かせる資格分野となると、公認会計士とか中小企業診断士がありますが、統計以外にもたくさん科目があって大変です。

Qアンケート結果の分析方法についての質問です。

看護研究でアンケート調査を実施する予定なのですが、分析方法が分かりません。統計学に詳しい方には初歩的なことで、呆れてしまうかもしれませんが、教えていただけると嬉しいです。
特定の集団に対して、ある症状について、ある人とない人に分け、その症状を誘発するといわれている要因について「よくある」から「全くない」の4群で回答、その症状から起こるといわれている身体的苦痛について「よくある」から「全くない」で回答、それぞれの関連を調べたいのです。
証明したいのは、この特定の集団が、ある症状になり易く、誘発する要因を多く持ち、身体的苦痛も多くあるということです。
分かりにくい説明だったら追加で説明したいと思います。よろしくお願いします。

Aベストアンサー

> 詳しい先生が不在で、質問することができず、慌てて質問しました。

時間的余裕があるなら、その先生に効くのが一番なのですが、それはおいておきましょう。


> 特定の集団の中で、ある症状について「非常に感じる」「感じる」「少し感じる」「全く感じない」に分けて、その4つの項目と、要因の「よくある」から「全くない」の4つ、身体的苦痛の「よくある」から「全くない」の4つとの関連を調べたいのです。

とのことですが、これがある症状の感じ方で要因の程度と身体的苦痛の程度に違いがあるのかを調べたいのであれば、カイ二乗検定でも良いでしょう。
症状の感じ方が強いほど、要因の程度と身体的苦痛の程度が強くなるということを言いたいのであれば、要因、身体的苦痛ごとにShirley-Williams検定かなと思います。
どの方法が良いかはその調査で何を主張したいかによって変わります。

また、どの方法を選んでも検定の多重性について注意をしてください。
これも場合によっては、個々の有意水準を調整する必要があるかもしれません。

Q統計士とデータ解析士という資格って?

新聞の広告で「統計士」と「データ解析士」という資格らしきものの名称をみかけました。
業務上勉強しておきたい分野ではありますが、公的に認知されている資格なのでしょうか?また、この資格を持っていることで有利なことってあるのでしょうか?

Aベストアンサー

公的な資格ではなく、資格商法の資格でしょう。
まったく素人になら通用するでしょうが、知った人には相手にされない資格ではないでしょうか。

QExcel 分析ツールの回帰分析の分散分析表に関して

「有意F」と「P-値」が意味するところを教えてください。

Aベストアンサー

直感的にイメージしやすいように、ご説明申しあげます。
ので、統計学的な厳密さから言うと、
私の説明は間違いです。
(正しく理解したい場合は、他の方の回答を信頼してください)

Excel分析ツール回帰分析の場合、
「有意F」はF検定に基づくP値、
「P-値」はt検定に基づくP値で、どちらも確率を示しています。

まず「有意F」は、
「この回帰モデルは全体として全く意味がない」と断言できる確率です。
ですから、この値が小さければ小さいほど回帰モデルとしてはよく出来ている
と思ってください。

つぎに「P-値」は、
「この説明変数には応答変数を説明する力がない」と断言できる確率です。
ですから、この値が小さければ小さいほど、説明変数としては力がある
と思ってください。
(切片のP-値は意味のないものなので無視しましょう)

分析ツールの回帰分析は、単回帰分析(説明変数が1つ)に限られていますから、
「有意F」と「P-値」は必ず同じ値になります。(実際に数値で確認してみてください)

なお補足になりますが、
Excel分析ツール回帰分析で「P-値」が表示されている部分は、分散分析表ではありません。
「分散分析表」にあたる部分は回帰、残差、合計で示された3行だけです。

直感的にイメージしやすいように、ご説明申しあげます。
ので、統計学的な厳密さから言うと、
私の説明は間違いです。
(正しく理解したい場合は、他の方の回答を信頼してください)

Excel分析ツール回帰分析の場合、
「有意F」はF検定に基づくP値、
「P-値」はt検定に基づくP値で、どちらも確率を示しています。

まず「有意F」は、
「この回帰モデルは全体として全く意味がない」と断言できる確率です。
ですから、この値が小さければ小さいほど回帰モデルとしてはよく出来ている
と思ってください...続きを読む

Qマーケティング関連で役立つ資格を教えてください。

マーケティング関連で役立つ資格を教えてください。
ランクと実用度が分かると助かります。
自分で調べた範囲だと下記となり、これ以外の資格を探しています。
ネットで調べた範囲では、これぞとピンポイントのものが少ないため、下記に少しでも役立ちそうな資格をお願いします。
仕事でマーケティング・コンサル部署所属、数値の集計分析統計業務担当、HP・会員の運営・解析に関わっている

初級 :統計士(文部科学省認定、現代統計実務講座の通信教育を修了、合格8カ月で修了可能)
中級 :マーケティング・ビジネス実務検定( 国際実務マーケティング協会、毎年2月6月10月実施、C級合格45%、B級)
上級 :中小企業診断士(中小企業診断士協会、毎年8実施、1次合格率16%→2次10%→最終3%)
上級 :ERE経済学検定試験(日本経済学教育協会、毎年7月12月実施、合格難易度S)
上級 :マーケティング・マスターコース(日本マーケティング協会認定、参加費100万円、合格約9カ月間の授業の後論文提出)

Aベストアンサー

一般論的に言えば、マーケティングは学校(大学、MBAや専門学校等)で学ぶものだと思いますが、
資格でいえば「診断士」はその分野では唯一の国家資格です。とはいえ、上記の目的はその一部にす
ぎないので、極めることには無理があります。また、各種検定試験は知識の効果測定が主目的ですの
で、実戦で役に立つかは本人の、その後の活用法によります。主に統計分析を学びたいようにお見受
けしますので、この中なら「統計士」が目的には一番近いと思われます。他は本当に統計はその一部
の学習分野に過ぎないと思いますので・・・ちなみに、「統計士」は民間資格扱いですので、特別な
権限や権利が付与される訳では無いですし、大学の経済学部等で学ぶ統計学をもう少し、一般向けに
平たくした感じの内容ですので、統計の基礎を習得するには丁度いいですが、高度な目的には不向き
かもしれませんね。いっその事、情報処理でも学んだ方がいいかもしれません・・・

Q重回帰分析と分散分析の結果が違う

次のようなRのコードを書きました。
x1~x7は因子で、1がなし2がありだと思ってください。
最後のxがデータです。これが大きい程よいと言う意味だと思ってください。

data <- data.frame(
x1 = c("1","1","1","1","2","2","2","2"),
x2 = c("1","1","2","2","1","1","2","2"),
x3 = c("1","1","2","2","2","2","1","1"),
x4 = c("1","2","1","2","1","2","1","2"),
x5 = c("1","2","1","2","2","1","2","1"),
x6 = c("1","2","2","1","1","2","2","1"),
x7 = c("1","2","2","1","2","1","1","2"),
x = c(35,48,21,38,50,43,31,22)
)

data
colnames(data) <-c("B","C","B:C","D","B:D","A","7","x")
data
summary(aov(x ~ A+B+C+D+B:C+B:D,data=data))
summary(lm(x ~ A+B+C+D+B:C+B:D,data=data))


結果としましては、
分散分析では因子C以外は有意差がないという結論を出しており、
重回帰分析では因子Bと因子B:D以外は有意差がないという結論を出しています。


重回帰分析と分散分析は基本的に数学的にやっていることは同じと言われたのですが、結果が異なり戸惑っています。
なぜこのようなことになったのか心当たりがある方ご教授ください。
よろしくお願いします。

次のようなRのコードを書きました。
x1~x7は因子で、1がなし2がありだと思ってください。
最後のxがデータです。これが大きい程よいと言う意味だと思ってください。

data <- data.frame(
x1 = c("1","1","1","1","2","2","2","2"),
x2 = c("1","1","2","2","1","1","2","2"),
x3 = c("1","1","2","2","2","2","1","1"),
x4 = c("1","2","1","2","1","2","1","2"),
x5 = c("1","2","1","2","2","1","2","1"),
x6 = c("1","2","2","1","1","2","2","1"),
x7 = c("1","2","2","1","2","1","1","2"),
x = c(35,48,21,...続きを読む

Aベストアンサー

企業でSQC推進を担当する統計家です。

まず、ご質問の趣旨から外れますが、
定石と言われるL8の割りつけは、主効果を列[1][2][4][7]の順で割り付けます。
今、A主効果が第6列に割りつけられていますので、CD交互作用と交絡しています。
マズイ実験ですよ。
CD交互作用によって、Aの効果が打ち消されている可能性があります。

では、本題です。
列名称が、「B:Cじゃダメ」という回答が、もう出ています。
B:Cは積項を作る演算記号だからです。
関数形指定の際に使用します。

さて、ご質問者はRのスクリプトもさることながら、
L8直交実験だから、列を使っても、積項を生成しても一緒でしょ。
と言いたくはありませんか。
たぶん、何かの本かサイトに、一致すると書いてあったのではないでしょうか。
実は、そうなんです。やってみえることは、何ら間違いではありません。
見方が違うだけです。
lmの結果はanovaで見なければいけません。

では、第1に、列名称をBCと変更して、
BCとB:Cの違いを、aovと、lmの結果をanovaで見たときを比較してみましょう。

第2に、L8直交表を変形して、全ての結果が同じになることを見ていきましょう。
直交表を変形する前は、第1列と第2列の積は、次のようになります。

[1][2]  [3]とは一致しない
1 1 → 1
1 1 → 1
1 2 → 2
1 2 → 2
2 1 → 2
2 1 → 2
2 2 → 4
2 2 → 4

では、水準を-1,+1のように、コード化してみましょう。
すると、第1列と第2列の積は、符号が違いますが第3列と一致します。

[1][2]   [3]と一致
-1 -1 → +1
-1 -1 → +1
-1 +1 → -1
-1 +1 → -1
+1 -1 → -1
+1 -1 → -1
+1 +1 → +1
+1 +1 → +1

こうすれは、ご質問者のやり方で何ら間違いはありません。

スクリプトは、以下に示します。
コピペして実行してみて下さい。

#
#計画行列はエクセルから貼り付けることも考慮して、こう書こう
#
dat <- data.frame(
matrix(c(
1,1,1,1,1,1,1,35,
1,1,1,2,2,2,2,48,
1,2,2,1,1,2,2,21,
1,2,2,2,2,1,1,38,
2,1,2,1,2,1,2,50,
2,1,2,2,1,2,1,43,
2,2,1,1,2,2,1,31,
2,2,1,2,1,1,2,22)
,ncol=8,nrow=8,byrow=T)
)
names(dat)=c("B","C","BC","D","BD","A","e","x")
dat
#
#正しい変数指定と間違った変数指定(B:Dとすると内部で生成)
#
summary(aov(x ~ A+B+C+D+BC +BD, data=dat)) #正
summary(aov(x ~ A+B+C+D+B:C+B:D,data=dat)) #誤だけど一致
summary(lm (x ~ A+B+C+D+BC +BD, data=dat)) #正
summary(lm (x ~ A+B+C+D+B:C+B:D,data=dat)) #誤一致しない
#
#内部生成してもANOVAを取れば結果は一致
#
result1 <- lm (x ~ A+B+C+D+B:C+B:D,data=dat)
anova(result1)
#
#回帰なら変数選択しておこう(正しい変数指定で)
#
result2 <-lm (x ~ A+B+C+D+BC+BD,data=dat)
result2.step <- step(result2)
summary(result2.step)
#
#変数選択したモデルでの分散分析結果は一致する
#
summary(aov(x ~ B+C+D+BC+BD,data=dat))
#
#コード化,中心化を行って、計画行列を正しい表現にする
#
dat.s <- dat[,-8]
dat.s <- (dat.s-1.5)*2
dat[,1:7] <- dat.s
dat
#
#そうすれば結果は全て一致する
#
summary(aov(x ~ A+B+C+D+BC +BD, data=dat)) #正
summary(aov(x ~ A+B+C+D+B:C+B:D,data=dat)) #誤だけど一致
summary(lm (x ~ A+B+C+D+BC +BD, data=dat)) #正
summary(lm (x ~ A+B+C+D+B:C+B:D,data=dat)) #正
#
#変数選択しておこう
#
result3 <-(lm (x ~ A+B+C+D+BC+BD,data=dat))
result3.step <- step(result3)
summary(result3.step)
#
#そうすれば、予測も可能
#
x <- data.frame(1,-1,1,1,1,1,1) #予測したいセット,ここでは-1~1の値を取る
index <- names(dat[1:7]) %in% names(result3.step$coefficients)
x <- x[index==TRUE]
p <- length(result3.step$coefficients)
y.hat <- (result3.step$coefficients[2:p] %*% t(x)) + mean(dat$x)
y.hat
#
#もちろん、元データを代入して、重相関を見ることも可能
#
x <- dat[,1:7]
index <- names(dat[1:7]) %in% names(result3.step$coefficients)
x <- x[index==TRUE]
p <- length(result3.step$coefficients)
y.hat <- (result3.step$coefficients[2:p] %*% t(x)) + mean(dat$x)
plot(y.hat,dat$x,pch=16)
r <- cor(t(y.hat),dat$x)
lm.obj <- lm(dat$x~t(y.hat))
abline(lm.obj,col=2)
mtext(substitute(paste(R,"=",r1),list(r1=r)))
#
#
#

企業でSQC推進を担当する統計家です。

まず、ご質問の趣旨から外れますが、
定石と言われるL8の割りつけは、主効果を列[1][2][4][7]の順で割り付けます。
今、A主効果が第6列に割りつけられていますので、CD交互作用と交絡しています。
マズイ実験ですよ。
CD交互作用によって、Aの効果が打ち消されている可能性があります。

では、本題です。
列名称が、「B:Cじゃダメ」という回答が、もう出ています。
B:Cは積項を作る演算記号だからです。
関数形指定の際に使用します。

さて、ご質問者はRのスクリプトもさ...続きを読む

Q統計学

現在、大学生で薬学部に通っています。
最近統計学に興味を持ち始め学んでみようかなと思ったのですが、統計学を学んだ所でこれといった資格は取れないとわかり少し迷っています。
そこで質問なのですが統計学を学ぶ事は、就活などにおいてどれほど役に立つのでしょうか?
何か知っていることがございましたらよろしくお願いします。

Aベストアンサー

アメリカやカナダの大学では統計学科を持っているところもあるようですが、日本では統計学科は見あたりません。この例でも明らかなように、残念ながら日本での統計学の認知度は高くありません。よって就活で役立つかと問われれば、その可能性は低いと言わざるを得ないでしょう。

ただ、sin456 さんにとって就活は今後の人生を左右する上での大きな試練でしょうから、それで使えるかどうかは重要な目安だと思いますが、その理由で統計学を学ぶかどうかをバッサリ判断してしまうのも、ちょっと寂しいような気がします。

就職が厳しくなってますしそうも言ってられないと思いますが、統計学も面白い学問ですので全く余裕が無いのでなければ、せっかく興味を持ったことですし学ばれてみてはいかがでしょうか。

QLeave-one-outを用いて重回帰分析やPLS分析の結果を検証したいと考えております。

Leave-one-outを用いて重回帰分析やPLS分析の結果を検証したいと考えております。
SPSSやJUMPといった一般的な統計ソフトでLeave-one-out法を使用できるものをご教示下さい。

Aベストアンサー

Rというフリーの統計ソフトなら可能です。
R Cross Validationで検索してみてください。

例えばbootstrapパッケージのcrossval関数など
他にもいろいろあります。

Q統計検定2級 数学レベル

仕事上で統計を使う機会が増えそうなので、統計学を勉強し始めています。

数学は高校で勉強した記憶が無いくらいの数学レベルですので、(もともと数学が苦手だったこともあり)中学レベルの数学からやり直しています。
現在、数学Aの順列や確率を勉強しているところです。
時間とやる気はあるので、公式の数学もある程度は理解できるような勉強をしたいと考えています。

質問なのですが、最終目標は(資格取得を目標にすると励みになるので)統計検定2級合格です。
基礎となるべき数学はどの程度(どの範囲)までやればよろしいでしょうか?
数学Aの図形問題は統計には関係ない気はしています。
数列や確率は直接関係するけど、数学Bや数学Ⅰ~Ⅱの範囲、また数学Ⅲ、Cの範囲も必要なのか、、、。
数学を高校で勉強していない(一年のときに数学A、Ⅰはやったはずですが、教科書を見る限り、まったく記憶に残っていませんでした)のでどの程度までが範囲なのか分からないのですが、
勉強レベルの全体像が分からないと、学習意欲にも影響がでるので質問をさせていただきました。
(統計の本をみたけれども、Σやlogをみて、さっぱり分からないレベルです)

よろしくお願いします。

仕事上で統計を使う機会が増えそうなので、統計学を勉強し始めています。

数学は高校で勉強した記憶が無いくらいの数学レベルですので、(もともと数学が苦手だったこともあり)中学レベルの数学からやり直しています。
現在、数学Aの順列や確率を勉強しているところです。
時間とやる気はあるので、公式の数学もある程度は理解できるような勉強をしたいと考えています。

質問なのですが、最終目標は(資格取得を目標にすると励みになるので)統計検定2級合格です。
基礎となるべき数学はどの程度(どの...続きを読む

Aベストアンサー

統計そのものには、高等な数学は使わないと思います。「数学」よりも「考え方」が大事かと思います。
高校数学の分野のことはよくわかりませんが、おおよそ次のような感じではないでしょうか。
↓ こちらを参考にしました。
https://ja.wikipedia.org/wiki/%E6%95%B0%E5%AD%A6_(%E6%95%99%E7%A7%91)

数学A
・場合の数と確立

数学B
・数列
・統計とコンピュータ

数学C
・確率分布
・統計処理

数学Ⅰ
・方程式と不等式 :これは何をやるにも基本です。
・二次関数

数学Ⅱ
・式と証明 (複素数は不要)
・指数関数、対数関数

数学Ⅲ
・関数と極限

Qエクセル2007でアンケート調査結果を作成中なんですが、集計表に結果を

エクセル2007でアンケート調査結果を作成中なんですが、集計表に結果を

エクセル2007でアンケート調査結果を作成中なんですが、集計表に結果をまとめたいのですが、今、凄く苦戦しております。(><)
内容は、
アンケート集計一覧
 B        C     D   E    F     G
1 コード      男性   女性   年齢   職業   使用感
2  1100       1         26   社会人  1.とても良い
3  1101           1     30   主婦   2.良い
    ↑
   と言うアンケート調査 


アンケート集計は下の内容です。
 I         J    K   L  M
          社会人  主婦  学生 その他  合計
6  1.とても良い
7  2.良い
8  3.どちらともいえない
9  4.悪い
10 5.とても悪い
社会人では(1.とても良い)と言う人は何人いるか?
どんな関数式を使えば良いのかわかりません。
わかる方関数式を教えてください。
お願いいたします。

エクセル2007で関数式SUMIF関数、を使ってやっていますが出来ませんでした。
何の関数を使って式を完成したら良いのか教えてください。

エクセル2007でアンケート調査結果を作成中なんですが、集計表に結果を

エクセル2007でアンケート調査結果を作成中なんですが、集計表に結果をまとめたいのですが、今、凄く苦戦しております。(><)
内容は、
アンケート集計一覧
 B        C     D   E    F     G
1 コード      男性   女性   年齢   職業   使用感
2  1100       1         26   社会人  1.とても良い
3  1101           1     30   主婦...続きを読む

Aベストアンサー

意味違ったですか?
アンケートのデータが第 n 行まであるとして、

セル P2 に =F2&G2 と入力し、
それを P3:Pn へコピーフィルする。

セル J6 に =COUNTIF(P2:Pn,J$5&$I6) と入力し、
それを J6:M10 へコピーフィルする。

…で、行けそうな気がするけど。


人気Q&Aランキング

おすすめ情報