os XPsp2、IE6.0でGetHTMLW7.14.0と巡集
ver1.59.2を使用しています。
gethtmlw.txtやFAQ, 問答集などを読んでも、全然わか
らないので困っています。
1.IE6.0でGetHTMLWのProxy Mode 1、Proxy
Mode 2の機能を使うためには、GetHTMLWの設定を
どのようにしたらいいのでしょうか。
2.GetHTMLWで画像ファイルや音声ファイルや圧縮フ
ァイルなどをHPと一緒に取得するためには、設定を
どのようにしたらいいのでしょうか。
3.GetHTMLWや巡集でひとつの画面で、画面の半分は
取得できたけれども、もう半分はテキストファイルみ
たいになっている場合は、どうすればよいのでしょう
か?
<html><head><title>ソフトウェア関連質問スレ用FAQ</title>
<meta name="robots" content="index,follow">
<meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS" />
<meta http-equiv="Content-Style-Type" content="text/css" />
いくらやり直してもこのようにうまくいきません。
4.GetHTMLWで、取得できないものとして、
(Shockwave-Flash 内の追跡は対応しましたが、Java,
JavaScript,その他純粋な HTML でないページには対
応していません)
と書いてあるのですが、具体的にはどのようなことを
さすのでしょうか。
もし、そういったものを取得したい場合は、どのよう
に対処すればよいのでしょうか。
5.巡集でHPをダウンロードすると、ダウンロード
したフォルダ名やファイル名が文字化けしていて、そ
のファイルを開くと、中身も文字化けしています。
その場合、どうやったら、きちんとダウンロードでき
るのでしょうか。
6.巡集の設定で「HTMLのタグを読まないとUR
Lの%を変換しない」は、どういう時にチェックをす
ればよいのでしょうか。
どうか宜しくお願いします。
A 回答 (3件)
- 最新から表示
- 回答順に表示
No.3
- 回答日時:
>拡張子/文字列フィルタの書式に、正規表現とい
著者によって内容が多少異なるので「正規表現」の言葉の意味は回答富農。
>って、どういうこと?
「階層内」とは4.と5.の間の「(選択値)階層まで取得」の「階層」。第一階層は.取得支持をした頁。第二階層は.取得支持した頁の<A><IMG>タグ等で参照している頁(ファイルを含む)。第三階層は第二階層の頁で<A><IMG>タグ等で参照している頁(ファイルを含む)。以下略。
この指定によりGethtmlwが取得・保存されるアドレスの範囲が決まる(実際には他の指定もありますが)。
これら指定に依存せず.実際に受信した(IEがキャッシュとして保存している内容を含まないの意味)ファィルをGetHtmlが保存するのがProxy mode 2。本来のプロキシサーバーとして機能します。
>どういう意味ですか?
http://oshiete1.goo.ne.jp/kotaeru.php3?q=1283552
>説明を省略されると、非常につらいです。
説明が省略できないと時間的に非常につらいです。
12月まで待っていただければ比較的時間も取れるのですが。
>さしているのでしょうか。
IEの設定であり.GetHTMLwの設定では有りません。
No.2
- 回答日時:
>ダウンロードされています。
>ヘルプが難しくて理解できません。
よりバージョンの違いで私の走査との違いがなければ
0.拡張子/文字列フィルターを使う
のレ印を消せばすべてのファイル識別子のファィルがDLの対象となります。
識別子とその意味については.どなたかの回答を参考にしてください。
>の意味がわかりません。
とほほ氏のサイトの説明から
http://www.tohoho-web.com/js/window.htm
http://www.tohoho-web.com/js/function.htm
Windows.open(URL)ですから直接URLを見つけることは可能です。しかし関数の場合.引数をみて判断する必要があるのでGetHTmlでは解釈できません。
>ProxyMode 2の機能を使うためには、GetHTML
1.GetrHtmlWを起動して.IEで受信したファイルが見える状態手にしてください(これでかなり説明がカット。ただしマニュアルでProxyサーバーの設定(Localhost 18080)をしてあるとして)。
2.IEをいったん終了し.ローカルファイルを何か表示させるようにして実行
3.GetHtml画面右上{X}マークの下に「Local....」という部分をクリック.{ProxyMode 2}等の表示が出たら「ProxyMode 2」をクリック。
4.IEのアドレス欄に受信したいURLを手入力。
JAVAの解釈をしてくれるので.HTTP受信の内容が保存されます。ただし.一部httpの規格に適合しない内容(WMP・アクロバット等が起動する場合等)では受信できません。
勝手に起動するソフトを起動しないように変更すると.「ファイルを保存しますか」の表示が出ます。これて保存してください(GetHtmlのディレクトリに保存されない場合があります)。
この回答への補足
>0.拡張子/文字列フィルターを使う
>のレ印を消せばすべてのファイル識別子のファィル
>がDLの対象となります
それが、一番楽な方法だけれども、そうすると、
あっというまに、ファイルが増えてしまって
収拾がつかなくなる自分が目に見える。
2.拡張子/文字列フィルタの書式に、正規表現とい
うものがあって、この説明がもう難しすぎます。
自分で調べてみても全然解からない。だめだこりゃ。
ヘルプに
>取得レベルが 2 の場合、
>次にかかれた拡張子(文字列)のある URL のデータ
>が、許された URL 階層外であっても
>取得を許します。
「許された URL 階層外であっても」
って、どういうこと?
とほほ氏のサイトの説明も
>Windows.open(URL)ですから直接URLを見つけること
>は可能です。
>しかし関数の場合.引数をみて判断する必要があるの
>でGetHTmlでは解釈できません。
用語も用語の説明も、難しくてお手上げです。
>IEで受信したファイルが見える状態手にしてくださ
>い
とはどういう意味ですか?
>(これでかなり説明がカット。
説明を省略されると、非常につらいです。
>勝手に起動するソフトを起動しないように変更する
>と.「ファイルを保存しますか」の表示が出ます。
>これて保存してください(GetHtmlのディレクトリに
>保存されない場合があります)。
具体的にGetHTMLWのどの機能や設定のことをさしてい
るのでしょうか。
No.1
- 回答日時:
OS画異なるのでOSの違いよる部分はご自身で調べてください(当方Win98)。
巡集をしらないのでこちらは回答富農。1.2.Gethtml単体での取得に成功していますか?。お知らせください(回答を書くのが面倒)。
単体での取得と.Proxymode2での取得では方法が異なりますから
3.経験なく回答富農。
4.単体で取得する場合に.Windows.openは解釈できるようです。しかし.関数で複雑回帰になっている場合には.解釈できません。取得したい場合にはProxymode2を使います。
この回答への補足
>1.2.Gethtml単体での取得に成功していますか?。
お知らせください(回答を書くのが面倒)。
1. WebPage データの取得
「動作(A)」→「WebPage取得(W)」で
取得するURLを入力しますという表示が出るので
保存するHPのURLを入力すると、ダウンロード
されています。
2.メニューの「設定(C)」→「取得条件設定(G)」
・[拡張子/文字列フィルタを使う]
の部分を変更すればいいと思うのですが、
ヘルプが難しくて理解できません。
>4.単体で取得する場合に.Windows.openは
>解釈できるようです。しかし.関数で複雑
>回帰になっている場合には.解釈できませ
>ん。
「Windows.open」、「関数で複雑回帰に
なっている場合には.解釈できません。」
の意味がわかりません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- JavaScript jqueryを使ったスムーススクロールのコードを書いたのですが、HTMLコード内にある、a butt 2 2022/04/14 10:59
- PHP PHPのエラーの解消法について教えて下さい。 1 2023/02/06 10:48
- PHP PHPでCookieを使った訪問回数について 1 2023/05/28 14:10
- HTML・CSS cssが効かなくて困ってます 1 2023/01/01 23:57
- JavaScript 入力フォームの javascript で メールアドレスの正規チェックをを行い、ボタンをクリックして 2 2022/04/27 16:06
- HTML・CSS <!DOCTYPE html> <html> <head> <meta charset="utf-8 2 2023/01/05 01:04
- HTML・CSS スクロールすると追従する画像のコードを書いているのですが、追従する画像の大きさの調節が上手くいきませ 2 2022/04/18 12:52
- HTML・CSS ボタンをクリックした時に、入力フォームのすぐ下部に、「入力欄が空白です」というテキストメッセージが表 1 2022/04/27 16:25
- HTML・CSS 下にスクロールしても、追従するボタンのコードを書いたのですが、ボタンの中の画像が半分しか表示されない 1 2022/04/16 21:31
- HTML・CSS 書籍を見つつサイト造りの練習をしているのですが、見た目が一致しません 2 2022/11/28 15:00
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
古いGoLiveで作ったサイトを最...
-
ショートカットからアクセスフ...
-
ソースを秀丸で開くと文字化け
-
edgeのファイル、edgeで開いて...
-
googleスプレッドシートについて
-
音楽ファイルの変換で文字化け
-
addlinkのインストールの仕方を...
-
オフラインのファイルなのにテ...
-
Lhacaのパスワードがかからない...
-
Firefoxのbookmark
-
ノートンの更新サービスで更新...
-
パワーポイントの設定かな。
-
FirefoxからInternet Explorer...
-
HPに写真をアップロードできま...
-
ブラウザoperaで新聞社の囲碁棋...
-
家族のPCから自分のHPやブログ...
-
秀丸エディタで表示列数を変更...
-
SafariでPHPソースがそのまま表...
-
イラストレーターのガイドを表示
-
印刷時にヘッターとフッターを...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
edgeのファイル、edgeで開いて...
-
IEで「信頼済みのサイト」にロ...
-
秀丸エディタで表示列数を変更...
-
同じメモ帳を2重に開かせたくな...
-
これはアップロードしたことに...
-
Lhacaのパスワードがかからない...
-
GIMPでパノラマ写真
-
拡張子がphpのファイルの開き方。
-
GOMプレイヤーで動画アイコンに...
-
エクセルファイルを開くと「プ...
-
Windows11でani.ファイルの開き...
-
Excelの共有ファイルについて
-
zipファイルを開くとき勝手に開...
-
添付ファイルが文字化け&送付...
-
Access2010で突然Excelデータが...
-
編集するで顔が変わらない
-
「このファイルを開く方法を選...
-
ワードパッドで書いたファイル...
-
グーグルドライブに保存したフ...
-
検索できないPDFを検索できるよ...
おすすめ情報