プロが教えるわが家の防犯対策術!

平面上の連続的分布?のばらつき具合を定量化したいです。

画像の各ピクセルに確率値(全ピクセルの値を足すと1になる)が入っており、画像上で人間がどこを見やすいかを確率的に示したデータがあり、添付画像中の3枚の画像はそれをヒートマップのように表示したものです(青色:見られる確率が高い ←→ 黄色:見られる確率が低い)。

この時に見られやすい地点(青色になっている地点)がどの程度バラついているかというのを定量化し、元画像の視覚的な繁雑度のようなものを数値化したいのですが、何か良い方法はありませんでしょうか?


イメージとしては、添付画像中の3枚の一番上が最もばらつきが小さく、一番下が最もばらつきが大きいというように示したいです。

データの形式は.npyもしくはExcelデータで、各セルに各ピクセルの持つ確率値が入っています。

「平面上の連続的分布?のばらつき具合を定量」の質問画像

A 回答 (4件)

企業で統計を推進する立場の者です。



定石の方法があります。一様分布との乖離をスカラー化すれば良いのです。これをディスクレパンシーと言います。
Measures of Uniformity Discrepancy で検索してみて下さい。

ディスクレパンシーの値は、Rのライブラリ kernlab の kmmd 関数で計算できます。

私は散布図でやったことがあります。打点数は1800点くらいでした。
でも、ご質問者のデータはグリッド化して度数あるいは確率値になっているのですか。それだと、ちょっと工夫が必要かもしれません。n個の座標値の生データがあれば、いとも簡単に指標化できます。

なお、文献ですが、私は一様計画という実験計画法の本で詳細を学びました。以下のページに一様性の指標について述べられています。
Kai-Tai Fang(2016Reprint)"Design and Modeling for Computer Experiments",(CRC Press),pp67-90
    • good
    • 0

No.1 です。

「お礼」に書かれたことを見ました。

>値の大きい地点が、画像の二次元平面上でどれくらい空間的にバラついているか

「ばらつき」というより、逆の見方をして「密度」ですかね。「密度の高いところ、低いところ」ということ。

それなら、文字通り平面を4分割、あるいは8分割、16分割して、それぞれの「確率」を求めればよいと思います。
あるいは、各分割エリアごとに「一定値以上のピークが何個あるか」「一定値以上の面積(ピクセル数)が何個あるか」を求めるとか。

要するに、「何を見たいのか」を決めれば、「それを端的に表すパラメータ」はすぐに定義できると思うのですが。
何をお迷いなのですか?
「自分がやりたいのは何か」の方をきちんと定義してみることをお勧めします。
    • good
    • 0

No.1 です。

ちょっと補足。

「勾配」をとるということは、連続分布データの「微分」をとるということです。「変化率」とか「傾き」とか、そういうことです。
    • good
    • 0

「ばらつき」そのものに相当するのは「等高線に囲まれた面積」です。

(あるいは等価的な「直径」のような「距離」)
例えば、そのピークの「70%高さ」で囲まれた面積などをその指標として使えばよいと思います。

あるいは、そのピークのまわりの「勾配」をとる方法もあります。勾配が急なほど鋭いピークなので「ばらつきが小さい」ということです。
地図の「等高線」から「傾斜」を求めるのと同じです。傾斜が急なほどピークが鋭いことになります。

いずれにせよ、「正規分布」などのカーブを見れば分かるように、「ばらつき」(分散、標準偏差など)は、ピークの「高さと幅の比」で決まりますから。
    • good
    • 0
この回答へのお礼

回答ありがとうございます!

yhr2さんの説明されているのは、数値的なばらつきと考えてよいのでしょうか?
いわゆる値の分散のような...。

だとしたら私の説明不足だったかもしれなくて、そういった値のばらつきではなく、値の大きい地点が、画像の二次元平面上でどれくらい空間的にバラついているかというのを考えているのですが、その場合はどうでしょうか...?

お礼日時:2020/07/13 14:22

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!