分散表現のベクトルにおいて、たとえばリンゴの特徴量をどのように抽出するのでしょうか？

解決済

質問者：park123
質問日時：2023/08/23 15:40
回答数：2件

AIなどで使われている分散表現について質問します。

たとえば、リンゴについて、特徴量を、１次元ベクトルでは０.５　２次元には０.８とか、３次元には・・・とか振りますよね。

質問は、リンゴの特徴量をどのように抽出するのでしょうか？

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (2件)

ベストアンサー優先
最新から表示
回答順に表示

No.2ベストアンサー

回答者： stomachman
回答日時：2023/08/28 13:51

> 振りますよね。

振らない。学習の過程で中間層に勝手に生成されるってことです。だから

> どのように抽出

してるんだか、いやそもそも一体何と何を抽出しているんだかも、よく分かんない。各成分(次元)の意味づけが（容易には）できないのが難点なんですよ。

- 0
- 件

通報する

この回答へのお礼

早速のご回答ありがとうございます。
最近のAIは、人に頼らず動いていますね。
暴走とまでは言えないでしょうが。
＜各成分(次元)の意味づけが（容易には）できない＞のですね。

通報する

お礼日時：2023/08/30 12:00

No.1

回答者： kantansi
回答日時：2023/08/23 16:04

分散表現（またはエンベディング）は、コンピュータがテキストやデータを理解し、数値ベクトルとして表現する手法です。

リンゴの特徴量を抽出するために、分散表現を作成する方法について説明します。

一般的に、分散表現の生成には以下のような手法が使用されます：

単語埋め込み（Word Embeddings）: 単語レベルの分散表現を生成するために使用される手法です。単語埋め込みは、コーパス（テキストデータの集合）を解析して単語の意味情報を学習し、それを数値ベクトルとして表現します。代表的な手法としてはWord2VecやGloVeなどがあります。

文脈的な情報の考慮: 単語の意味はその周囲の単語との関係によっても決まることが多いです。したがって、文脈的な情報を考慮しながら単語埋め込みを生成する手法もあります。例えば、Skip-gramモデルやCBOWモデルは、単語の周囲の文脈を利用して埋め込みを学習します。

事前学習と転移学習: 大規模なデータセットで単語埋め込みを事前学習し、それをタスクに応用する手法もあります。転移学習と呼ばれ、限られたデータで高品質の分散表現を得るのに役立ちます。

ニューラルネットワーク: ニューラルネットワークを使用して、単語や文の意味を表す特徴量を学習する手法もあります。これにはリカレントニューラルネットワーク（RNN）、長短期記憶（LSTM）、トランスフォーマーなどが使われます。

具体的なリンゴの特徴量を抽出する場合、テキスト中の「リンゴ」に関する文脈や他の単語との関係性を考慮して、適切な分散表現を生成することが求められます。このような手法によって、テキスト情報を数値表現に変換し、コンピュータが理解しやすい形式に変換することが可能となります。

- 0
- 件

通報する

この回答へのお礼

早速のご回答ありがとうございます。
今、分からなくなってきました。教えて下さい。
１．たとえば＜単語埋め込み＞は、リンゴの分散表現ができていなくとも、可能なのですか？（＜単語埋め込み＞の過程において、リンゴの分散表現ができる？）
２．あるいは、事前にリンゴの分散表現ができているから＜単語埋め込み＞ができるのですか？

通報する

お礼日時：2023/08/23 18:24

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう！