大学で自動要約について研究しています。研究を行う上でtiny_summarizerという自動要約システムを使用しているのですが、javascriptには詳しくなく、正直、プログラムの内容がほとんど理解できていません。
とりあえず理解できているのは、tiny_segmenterとTinySplitterで文章を分かち書きし、文分割したものをtiny_summarizerに送り、重要な単語の抽出、重要文の抽出、要約文字数に合った文の抽出を行って要約しているということです。
しかし、tiny_summarizerがどのような基準、手法で単語を選別しているのか、プログラムを見ても理解ができませんでした。
作者様のページでは
「様々な文書ドメインにおいて比較的頑健であると思われる単語頻度のみを用いて重要文の抽出を行っています。TinySegmenter による前処理を想定しているため、品詞による内容語と機能語の選別を行っておらず、内部に保持したストップ・ワードのリストに基づいて重要文の抽出に利用する単語の選別を行います。」
と書かれています。
作者様のページから、tiny_summarizerをダウンロードして頂いて、TinySummarizer.jsの内容について説明していただけるとありがたいです。
参考URL:https://hitoshin.github.io/tiny_summarizer/
No.1ベストアンサー
- 回答日時:
TinySummarizer.prototype.summarize = function(words, length) {
this.preprocess(words);
this.decode(length);
return this.output();
}
とあるので、summarizeに引数をつけて呼び出すとこの順序で実行される
this.preprocessでは、引数の配列 words が評価される。(おそらく行を配列に、その行は単語に分かれ、さらに配列にしてあると推測。二次元配列。)
評価としては 各単語?にstop_wordsが含まれていなければ、その単語の評価値を上げる
行ごとにその行で評価された単語の点数を加算して合計を求める
あとの this.decode は誰かに任せた。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 英語 ソシュール言語観による品詞、単語、辞書理解の誤り 4 2022/11/24 12:27
- 日本語 自立語/付属語という品詞区分の誤り 5 2022/09/05 00:20
- 哲学 概念について 1 2023/04/09 15:09
- 大学受験 自己推薦書の添削や意見・アドバイスお願いします 2 2022/08/27 19:34
- 日本語 脳科学の奇妙な言語獲得論 2 2022/04/04 13:13
- 英語 英文法でこのasの意味 6 2022/10/22 00:20
- 大学受験 3浪しようと思うので、アドバイスお願いします。 自分としては結構メンタルきつくて後期でいいから、東京 3 2023/02/13 21:47
- 留学・ワーキングホリデー 大至急!! 1 2022/09/19 19:42
- 労働相談 合意済み仕様の商品納入後における仕様変更要求への対応について 5 2023/04/19 09:41
- 国家公務員・地方公務員 公務員試験の数的処理で苦戦しています。 1 2023/01/30 08:56
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
C#テキストボックスの文字を配...
-
同じIDで定義した要素の配列を...
-
二次元配列の全要素の全要素を...
-
javascript 変数名の連結をしたい
-
React hooksが値を返して配列変...
-
順列生成アルゴリズムについて...
-
undefinedを表示させない方法は...
-
重複しないようにランダムで表...
-
同じ型【ハイフンと数字】だけ...
-
関数でy=g(x)のgとは何の略です...
-
ボタンをクリックすると数が増...
-
URLのパラメータを取得しリンク...
-
Excel VBA の ChangeFileAccess
-
idを使わずにonclickで自身の要...
-
getElementByIdを使用したグロ...
-
<a>タグのテキストを取得
-
DOM要素を削除しても、イベント...
-
ジェネレーターの作り方
-
HTML:Tableタグに対し、JavaScr...
-
javascriptでテーブルに追加し...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
同じIDで定義した要素の配列を...
-
C#テキストボックスの文字を配...
-
React hooksが値を返して配列変...
-
オブジェクトから任意のプロパ...
-
javascript 変数名の連結をしたい
-
jspからjavascriptの変数引継ぎ
-
配列の1要素を代入した変数を使...
-
JavaScriptにおける[] とか :...
-
フォーム入力値の重複チェック
-
javascriptで行を抽出したいです。
-
undefinedを表示させない方法は...
-
javascriptで2つのArrayの...
-
WSH(Jscript)でファイル一覧
-
JavaScriptでの動的な多次元配...
-
Perlの配列をJavaScriptに渡せ...
-
[JS] setAttributeで保存される...
-
JSONデータを50音順でソートしたい
-
二次元配列の全要素の全要素を...
-
javascriptを用いて作成された...
-
バナーのランダム表示(複数、...
おすすめ情報