急いでいます！

ベクトル量でヒストグラム

締切済

質問者：ぴーやと
質問日時：2021/07/01 14:48
回答数：1件

スカラー量（ex. N人の身長）に対しては、適当な階級の幅を設定して「ヒストグラム」を作ることで簡単な量子化（データを複数のグループに分けること）ができる。これに対して、ベクトル量（ex. 音声のケプストラム特徴量）の場合も、各次元に対して同様に階級の幅を設定してヒストグラムのようなグループ分けをすれば良さそうに見えるが、実はそれはあまり賢い方法ではい。なぜそれではうまくいかないかの理由を「クラスタリング」と「ベクトル量子化」に関連付けて述べよ。という課題が分かりません。よろしくお願いします。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (1件)

最新から表示
回答順に表示

No.1

回答者： kamiyasiro
回答日時：2021/07/02 11:19

企業で統計を推進する立場の者です。

参考意見です。

高次元だとスパース化して、そもそもヒストグラムが作れるだけの空間充填性がないですね。
クラスター分析も、距離を使ったものは高次元では各サンプルがほぼ等距離になるので破綻します。

でもt-SNEやUMAP、SIRという次元削減、次元縮約という方法を使ったクラスタリングをやれば済む話ですよ。

上手くいかないのではなく、工夫すればできます。

すみません。回答になっていませんね。ですが、私は20年前に出た問題かと思いました。