
A 回答 (2件)
- 最新から表示
- 回答順に表示
No.2
- 回答日時:
#1です。
書き忘れましたが、注意点です。
01データのダミー変数が男女というように項目(変数)が1つであれば問題ありません。
ところが、下記のような場合は問題があります。
たとえば
習熟度123を、それぞれ該当するところに1を立て、
初心者01
中級者01
上級者01
というようにダミー変数化すると、3つの変数の間に線形制約が入りますので一般の重回帰分析ではXTXの逆行列がとれなくなり、解けません。
このとき、習熟度は順序尺度なので、ダミー変数化せずに用います。
次に、
住宅種類123は
戸建て01
マンション01
賃貸01
というようにダミー変数化するしかありません。住宅種類は名義尺度だからです。でも線形制約が入り解けません。
このときは、L1正則化回帰ラスー(ラッソという人もいます)を用います。
住宅種類としてまとめてモデル式に効いているかどうか知りたいときは、戸建て、マンション、賃貸の間にはL2正則の罰則をかけ、住宅種類は他の、年収、勤続年数などと並列にL1正則の罰則をかけます。これはグループ・ラスーという回帰方法です。
No.1
- 回答日時:
企業でSQCを推進する者です。
博士(工学)です。数量化Ⅰ類では、ダミー変数は、切片の変更のみに反映することが多いですが、
ご質問者は、そのxに係数βを与えたいとお考えなのですね。
でもご心配なく。そのまま行えば良いです。
多くのソフトでは、内部で「中心化」を行ってから、
β=(XTX)^-1XTy
でβを求めます。(Tは転置です)
ですから、回帰上の原点は、重心になっていますので大丈夫です。
βの信頼限界は0側が原点に近いですので、1側が広くなります。
データ数が少ないから、信頼限界も広がると思えばいいですよね。
ところで、この説明は中心化あり、の場合で有効です。
私は理系のため、中心化したXTXを用いますが、
経済系の人たちは、中心化せず、さらには定数項列(1が並ぶ列)を加えてXTXをとります。
ですが、このときも結果は一致しますので、問題はありません。
ただ、後者がなぜ、回帰線が結果的にデータ重心を通るのかを説明しろと言われても、勉強不足のためできません。すみません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
高校 数学 aを実数の定数とする...
-
サンプル数の異なる2群間にお...
-
対数グラフ用紙に収まらない場...
-
数学の微分の応用の問題につい...
-
【困っています!エクセルでのt...
-
全商推薦について教えてください。
-
投稿論文を作成にあたり数年前...
-
パイロットサンプルって何ですか?
-
EXCELにてローパスフィルタを作...
-
統計について
-
グラフの軸の説明
-
卒業論文のアンケートの数について
-
統計 RSD%について教えて下さい。
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
-
対照群vs多群との割合の比較
-
グラフの"eye guide"について
-
二項分布B(n,p)の中央値(メデ...
-
データが正規分布しているか判...
-
対応のあるt検定の結果の書き方
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
エクセルのグラフから半値幅を...
-
検量線の決定係数について
-
下の対数表示のグラフから低域...
-
最小二乗法を反比例の式を元に...
-
線形なグラフとはひとくちに言...
-
死傷者数と死者数の違いって何...
-
ノンパラメトリック検定の多重...
-
【統計】有意に「高い」?「低...
-
統計について
-
パイロットサンプルって何ですか?
-
エクセルの統計でχ二乗検定の結...
-
検定公差を教えてください!
-
検定統計量の値がマイナス
-
データ点を線で結ぶ場合と結ば...
-
アンケートの集計分析の基礎(...
-
曲面z=log(x^2+y^2)のグラフの...
-
心理機能診断をしたのですが、...
-
理科のグラフで、直線と曲線の...
おすすめ情報