JavaとJavascriptどちらに質問すべきか迷ったのですが
こちらで質問させていただきます。
Javascriptを含むWebサイトのHTMLの構文を解析して、
そのサイトに表示されるデータなどを収集するjavaプログラムを作りたいんです。
Googleなどでいろいろ検索して調べたのですが、
このようなことを解説してくれているサイトが見当たらなかったので
解説してくれているサイトだとか書籍などを紹介していただきたいのです。
また、どのように作成していけばいいのか、大まかな流れだとかヒントになるようなことを教えていただいてもうれしいです。
Javascript自体は現在勉強中なレベルなのでまずはそこからではあるんですが・・・。
No.3ベストアンサー
- 回答日時:
>どのように作成していけばいいのか、大まかな流れ
どうも Javascript 以前に HTML やWebブラウザといったWebの基礎技術の理解が不足しているように思われます。
「Javascript自体は現在勉強中」というのは「Javascriptの役割はすでに理解していて、実際の言語仕様などを現在勉強中」という意味に自分は誤解してしまったようです。
いきなり Java のコードを書こうとするよりまずは Web の基礎技術を学んでみてください。
Webブラウザはまさに「Javascriptを含むWebサイトのHTMLの構文を解析して、そのサイトに表示されるデータなどを収集するプログラム」ですから、
ブラウザが何をしているのかわかれば、ご自分のやりたいことを実現する手段は見えてきます。
そうなったらあとは必要なパーサやスクリプトエンジンといったライブラリを用意するだけです。
そのプログラムが具体的に何をしたいのか示されていないので、これ以上具体的な流れはお答えする方法がありません。同様の理由で、
>上記のリンク先の文書に書いてあるような解析方法でいいのでしょうか?
という質問の答えがわかるのは、質問者のかただけです。
No.2
- 回答日時:
どの程度使えるものなのかは自分は知らないのですが、
JavaSE には標準でHTML パーサが搭載されているようです。
http://java.sun.com/javase/ja/6/docs/ja/api/java …
また、「HTML パーサ」というキーワードで検索してみると、以下のようなものが見つかりました。
http://htmlparser.sourceforge.net/
また、Java向けのJavascriotエンジンとしてはRhinoががあります。
これはSun の JavaSE6 には標準で搭載されるようになりました。
http://www.mozilla.org/rhino/
http://java.sun.com/javase/ja/6/docs/ja/technote …
これだけ揃っていればHTMLの解析は難しくは内容に思います。
回答ありがとうございます。
またしても返事が遅れて申し訳ありません。
RhinoはJavaScriptのコードをJavaのクラスへと変換するものということですが、
これを利用してJavascriptの解析をどのようにすればいいんでしょうか・・・?
質問ばかりですいません。
No.1
- 回答日時:
??
DOM辺りで調べたらそれなりの情報が得られるんじゃないかな
後は完全にレンダリングさせた結果を得られる方法を探すとか。
回答ありがとうございます。
返事が遅くなって申し訳ありません。
いろいろDOMを調べてみたのですが、
http://sel.ist.osaka-u.ac.jp/~lab-db/betuzuri/ar …
おおまかな流れとしては、
上記のリンク先の文書に書いてあるような解析方法でいいのでしょうか?
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・「みんな教えて! 選手権!!」開催のお知らせ
- ・漫画をレンタルでお得に読める!
- ・【大喜利】【投稿~1/20】 追い込まれた犯人が咄嗟に言った一言とは?
- ・洋服何着持ってますか?
- ・みんなの【マイ・ベスト積読2024】を教えてください。
- ・「これいらなくない?」という慣習、教えてください
- ・今から楽しみな予定はありますか?
- ・AIツールの活用方法を教えて
- ・【選手権お題その3】この画像で一言【大喜利】
- ・【お題】逆襲の桃太郎
- ・自分独自の健康法はある?
- ・最強の防寒、あったか術を教えてください!
- ・【大喜利】【投稿~1/9】 忍者がやってるYouTubeが炎上してしまった理由
- ・歳とったな〜〜と思ったことは?
- ・ちょっと先の未来クイズ第6問
- ・モテ期を経験した方いらっしゃいますか?
- ・好きな人を振り向かせるためにしたこと
- ・【選手権お題その2】この漫画の2コマ目を考えてください
- ・【選手権お題その1】これってもしかして自分だけかもしれないな…と思うあるあるを教えてください
- ・スマホに会話を聞かれているな!?と思ったことありますか?
- ・それもChatGPT!?と驚いた使用方法を教えてください
- ・見学に行くとしたら【天国】と【地獄】どっち?
- ・これまでで一番「情けなかったとき」はいつですか?
- ・この人頭いいなと思ったエピソード
- ・あなたの「必」の書き順を教えてください
- ・14歳の自分に衝撃の事実を告げてください
- ・人生最悪の忘れ物
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
データベースのデータをTextBox...
-
占いサイトを作りたいのですが...
-
VBAの「for i=1 to cells(…」...
-
cまたはc++は半年である程度...
-
Struts1.1をつかったDB接続方法
-
エクセル VBAでフォルダ内のPDF...
-
中学生でいきなりJava
-
VC#とVC#.NETの違い
-
JAVA初心者のWeb開発の勉強方法
-
Javascriptを含むHTML構文解析...
-
XMLとUMLの相違点?
-
C言語を学ぶにあたっての数学の...
-
エクセルVBAを動かすノートPC...
-
使用しているJUnitのバージョン...
-
vba クリップボードクリアにつ...
-
ウインドウズメディアプレーヤ...
-
CrystalReportsのバージョン確...
-
JSPファイルで生じるエラーをど...
-
MSCOMCTL.OCXのアップデートの方法
-
gitでバージョン指定してダウン...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
MSFormsとは何ですか?
-
VBAの「for i=1 to cells(…」...
-
データベースのデータをTextBox...
-
エクセルVBAを動かすノートPC...
-
2ショットチャットができるHP...
-
超恥愚問ですが、CとC++の間に...
-
VC#とVC#.NETの違い
-
cまたはc++は半年である程度...
-
VBAなくなるの?
-
C++ですごろくゲーム作成
-
XMLとUMLの相違点?
-
cin.peek() cin.ignore(100,'\\n')
-
ディープラーニング ResNets50...
-
jQueryでリアルタイム更新をし...
-
C#とDelphiの違いについて
-
画像編集ソフトの作り方
-
php、Java(Servlet等)の両方を...
-
ASP、ASP.NETの勉強をしたいの...
-
エクセル VBA の用語一覧について
-
Struts1.1をつかったDB接続方法
おすすめ情報