dポイントプレゼントキャンペーン実施中!

機械学習のプログラミング(Python)の課題で「xとyに基づいてzを3つのクラスタに分割し散布図で表示せよ(x,y,zはDataFrameにある)」という問題があるのですが、これはx軸y軸にxyzのどれを設定すればいいのでしょうか?

A 回答 (4件)

#1です。

コメントありがとうございます。

zは日付だとすると、その処理のしかたを考えなければいけませんね。

x,yの値を使ってk-meansでクラス番号を付与した後、x-y座標上にクラス毎に色分けして散布図を描きますが、ここまでは、x,yの可視化です。

zの情報を活かすためには、各プロットを時間順に線でつないでみてはどうでしょうか。

でも、n=300もあるとぐちゃぐちゃになってしまうかなあ。

x-y平面散布図内に時間変化の情報をどう盛り込むかですよね。

たとえば、ハイライト(着色)する数を50個くらいにして、時間順に25個くらいずつハイライトする窓をずらしながら、次々散布図を並べて描くという方法であれば時間情報を可視化できますね。ハイライト以外はグレーでプロットすれば良いと思います。

ちょっと違いますが、時間的変化の可視化事例を添付します。左上から右に進んでいます。
「機械学習のプログラミング(Python)」の回答画像3
    • good
    • 0
この回答へのお礼

ありがとう

なるほど!グラデーションにするのは良いですね。参考にしてやってみたいと思います。ありがとうございました。

お礼日時:2021/12/14 22:12

散布図に表示せよ、が仕様だから、グラデーションはマズいでしょ。

    • good
    • 0
この回答へのお礼

遅くなってすいません!先生にはOKもらえたので大丈夫でした!ありがとうございました

お礼日時:2021/12/18 05:10

xyがグリッドで、zが頻度だったりしてね。



もしそうなら、そうとう厄介な問題ですよ。
    • good
    • 0

zのカラムには、何が入っているのですか?



サンプル数(行数)はどれくらいですか?

データの背景が分からない時は、3×3の散布図行列に出力して、クラスター分析結果に基づて色分けしておけばいいのでは?
    • good
    • 0
この回答へのお礼

zは日付の数値が入っていてx,yも数値が入ってます。
行数は300行です。
k-Means法でやろうと思ってます。

お礼日時:2021/12/14 16:16

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!