大学で自動要約について研究しています。研究を行う上でtiny_summarizerという自動要約システムを使用しているのですが、javascriptには詳しくなく、正直、プログラムの内容がほとんど理解できていません。
とりあえず理解できているのは、tiny_segmenterとTinySplitterで文章を分かち書きし、文分割したものをtiny_summarizerに送り、重要な単語の抽出、重要文の抽出、要約文字数に合った文の抽出を行って要約しているということです。
しかし、tiny_summarizerがどのような基準、手法で単語を選別しているのか、プログラムを見ても理解ができませんでした。
作者様のページでは
「様々な文書ドメインにおいて比較的頑健であると思われる単語頻度のみを用いて重要文の抽出を行っています。TinySegmenter による前処理を想定しているため、品詞による内容語と機能語の選別を行っておらず、内部に保持したストップ・ワードのリストに基づいて重要文の抽出に利用する単語の選別を行います。」
と書かれています。
作者様のページから、tiny_summarizerをダウンロードして頂いて、TinySummarizer.jsの内容について説明していただけるとありがたいです。
参考URL:https://hitoshin.github.io/tiny_summarizer/
No.1ベストアンサー
- 回答日時:
TinySummarizer.prototype.summarize = function(words, length) {
this.preprocess(words);
this.decode(length);
return this.output();
}
とあるので、summarizeに引数をつけて呼び出すとこの順序で実行される
this.preprocessでは、引数の配列 words が評価される。(おそらく行を配列に、その行は単語に分かれ、さらに配列にしてあると推測。二次元配列。)
評価としては 各単語?にstop_wordsが含まれていなければ、その単語の評価値を上げる
行ごとにその行で評価された単語の点数を加算して合計を求める
あとの this.decode は誰かに任せた。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 英語 ソシュール言語観による品詞、単語、辞書理解の誤り 4 2022/11/24 12:27
- 日本語 自立語/付属語という品詞区分の誤り 5 2022/09/05 00:20
- 哲学 概念について 1 2023/04/09 15:09
- 大学受験 自己推薦書の添削や意見・アドバイスお願いします 2 2022/08/27 19:34
- 日本語 脳科学の奇妙な言語獲得論 2 2022/04/04 13:13
- 英語 英文法でこのasの意味 6 2022/10/22 00:20
- 大学受験 3浪しようと思うので、アドバイスお願いします。 自分としては結構メンタルきつくて後期でいいから、東京 3 2023/02/13 21:47
- 留学・ワーキングホリデー 大至急!! 1 2022/09/19 19:42
- 労働相談 合意済み仕様の商品納入後における仕様変更要求への対応について 5 2023/04/19 09:41
- 国家公務員・地方公務員 公務員試験の数的処理で苦戦しています。 1 2023/01/30 08:56
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
同じIDで定義した要素の配列を...
-
多次元配列から最大値を1行また...
-
(google apps script)スプレ...
-
空の配列に2次元配列の追加
-
JSONデータを50音順でソートしたい
-
javascript 変数名の連結をしたい
-
JavaScriptにおける[] とか :...
-
undefinedを表示させない方法は...
-
C#テキストボックスの文字を配...
-
配列変数に重複のないランダム...
-
JavaScriptで2次元配列を扱う方法
-
google apps scriptの終了のさせ方
-
C#OpenCv V4にのエラーに関する...
-
onchangeイベントを使ってspan...
-
1日1回引けるJavaScriptおみく...
-
Click回数を数え、規定された回...
-
canvas上で画像を移動する方法...
-
C# .NET DataGridView の行を追...
-
jslintのエラーについて質問
-
var_dumpのdump意味はを知りた...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
同じIDで定義した要素の配列を...
-
C#テキストボックスの文字を配...
-
React hooksが値を返して配列変...
-
オブジェクトから任意のプロパ...
-
javascript 変数名の連結をしたい
-
jspからjavascriptの変数引継ぎ
-
配列の1要素を代入した変数を使...
-
JavaScriptにおける[] とか :...
-
フォーム入力値の重複チェック
-
javascriptで行を抽出したいです。
-
undefinedを表示させない方法は...
-
javascriptで2つのArrayの...
-
WSH(Jscript)でファイル一覧
-
JavaScriptでの動的な多次元配...
-
Perlの配列をJavaScriptに渡せ...
-
[JS] setAttributeで保存される...
-
JSONデータを50音順でソートしたい
-
二次元配列の全要素の全要素を...
-
javascriptを用いて作成された...
-
バナーのランダム表示(複数、...
おすすめ情報