
大学で自動要約について研究しています。研究を行う上でtiny_summarizerという自動要約システムを使用しているのですが、javascriptには詳しくなく、正直、プログラムの内容がほとんど理解できていません。
とりあえず理解できているのは、tiny_segmenterとTinySplitterで文章を分かち書きし、文分割したものをtiny_summarizerに送り、重要な単語の抽出、重要文の抽出、要約文字数に合った文の抽出を行って要約しているということです。
しかし、tiny_summarizerがどのような基準、手法で単語を選別しているのか、プログラムを見ても理解ができませんでした。
作者様のページでは
「様々な文書ドメインにおいて比較的頑健であると思われる単語頻度のみを用いて重要文の抽出を行っています。TinySegmenter による前処理を想定しているため、品詞による内容語と機能語の選別を行っておらず、内部に保持したストップ・ワードのリストに基づいて重要文の抽出に利用する単語の選別を行います。」
と書かれています。
作者様のページから、tiny_summarizerをダウンロードして頂いて、TinySummarizer.jsの内容について説明していただけるとありがたいです。
参考URL:https://hitoshin.github.io/tiny_summarizer/
No.1ベストアンサー
- 回答日時:
TinySummarizer.prototype.summarize = function(words, length) {
this.preprocess(words);
this.decode(length);
return this.output();
}
とあるので、summarizeに引数をつけて呼び出すとこの順序で実行される
this.preprocessでは、引数の配列 words が評価される。(おそらく行を配列に、その行は単語に分かれ、さらに配列にしてあると推測。二次元配列。)
評価としては 各単語?にstop_wordsが含まれていなければ、その単語の評価値を上げる
行ごとにその行で評価された単語の点数を加算して合計を求める
あとの this.decode は誰かに任せた。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
同じIDで定義した要素の配列を...
-
javascriptで行を抽出したいです。
-
ASP.NETのコントロールの値をJa...
-
ページ内に複数表がある場合のT...
-
【正規表現】【javascript】CR...
-
RadioButtonListの表示制御
-
複数のxmlを同ページに読み込み...
-
jQueryのload()を使用して外部...
-
ジャバスクリプトで空白(スペー...
-
クリックすると上に開くアコー...
-
商品コードを入力で、商品名、...
-
要素名がスペースを含む場合のj...
-
getElementByIdを使用したグロ...
-
バイナリファイルから文字列を...
-
DIV内のDIV要素を移動する。
-
Javascriptで定期的にF5を押す...
-
hoge の謎
-
window.openでタイトル名の指定
-
var_dumpのdump意味はを知りた...
-
WordPressのコンタクトフォーム...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
C#テキストボックスの文字を配...
-
jspからjavascriptの変数引継ぎ
-
同じIDで定義した要素の配列を...
-
二次元配列を使って順位をだす...
-
Ascition Script2
-
配列番号を自動的に一括して入...
-
テトリス / 配列をブロックに...
-
空の配列に2次元配列の追加
-
undefinedを表示させない方法は...
-
javascriptで行を抽出したいです。
-
textareaに入力されたデータを...
-
Perlの配列をJavaScriptに渡せ...
-
助けてください‼︎ javascriptで...
-
(google apps script)スプレ...
-
javascript 変数名の連結をしたい
-
Javascript 配列の使い方について
-
JSON形式で取得した8桁の数字を...
-
行列データ?の文字列操作につ...
-
雪を降らせるみたいな、ゆらゆ...
-
配列データの利用方法
おすすめ情報