
LWPを使ってHTMLを取得しようとしているのですが、取得可能のサイト、不可能のサイトがあります。
たとえばyahooのトップページは取得できますが、wikipediaは取得できません。取得できない場合、エラーメッセージは出ません。
このようになる理由を教えてください。
よろしくお願いいたします。
環境:windowsXP & ActivePerl、またはwindowsXP & cygwin
コード:
#wikipediaのトップページHTMLを取得する
use LWP::Simple;
$site = get "http://ja.wikipedia.org/wiki/%E3%83%A1%E3%82%A4% …
print $site;
#yahooのトップページHTMLを取得する
use LWP::Simple;
$site = get "http://www.yahoo.co.jp/";
print $site;
No.2ベストアンサー
- 回答日時:
wikipedia では、LWP::Simple のアクセスを許可していないのだと思います。
get() の代わりに getprint() を使用すると、次のエラーメッセージが出ます。
$ perl -MLWP::Simple -e "getprint 'http://ja.wikipedia.ogr/';"
403 Forbidden <URL:http://ja.wikipedia.org/>
下記の URL でほぼ同じ問題を取り上げていますのでご覧ください。
参考URL:http://www.atmarkit.co.jp/bbs/phpBB/viewtopic.ph …
No.1
- 回答日時:
ユーザーエージェントで弾いてるんじゃないですか
Googleとかもlibwww-perlの方弾いてます
LWP::Simpleのリクエストヘッダはこれで403 Forbiddenとエラーページ返ってきてます
GET http://ja.wikipedia.org/wiki/%E3%83%A1%E3%82%A4% … HTTP/1.1
TE: deflate,gzip;q=0.3
Connection: TE, close
Host: ja.wikipedia.org
User-Agent: LWP::Simple/5.814
LWPを使った場合はこれで200 OKでちゃんとコンテンツ返ってきてます
GET http://ja.wikipedia.org/wiki/%E3%83%A1%E3%82%A4% … HTTP/1.1
TE: deflate,gzip;q=0.3
Connection: TE, close
Host: ja.wikipedia.org
User-Agent: libwww-perl/5.814
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- ノートパソコン 買うならどっちのノートパソコンにしますか? 1 2022/07/15 16:06
- 防犯カメラ・監視カメラ・小型カメラ 屋外用のIPカメラ(ライブカメラ)の位置情報について 1 2022/06/23 18:32
- Windows 10 プロファイルエラーについて 2 2022/12/16 09:31
- WordPress(ワードプレス) 【WordPress/PHP】取得した値(日本語)がエンコードされてしまうのを日本語のまま出力したい 1 2022/08/28 22:59
- CPU・メモリ・マザーボード Dell製ノートパソコンのメモリ増設についてです! 6 2023/06/10 21:31
- iPhone(アイフォーン) こちらWEB検索できるかが分かりません それからこちらの最安値があれば教えてください https:/ 2 2022/09/14 14:09
- デスクトップパソコン パソコンが重くなった 34 2022/06/14 19:41
- タブレット 第10世代 Fire HD 8 △(左向き)、〇、□のマークが表示されない 2 2022/12/18 17:02
- 工学 人間と人口知能の違い 3 2022/05/31 13:34
- その他(プログラミング・Web制作) pythonをjupiter notebookからmecabで頻出の高い単語の抽出について(Runt 1 2022/12/17 18:08
関連するカテゴリからQ&Aを探す
今、見られている記事はコレ!
-
弁護士が語る「合法と違法を分けるオンラインカジノのシンプルな線引き」
「お金を賭けたら違法です」ーーこう答えたのは富士見坂法律事務所の井上義之弁護士。オンラインカジノが違法となるかどうかの基準は、このように非常にシンプルである。しかし2025年にはいって、違法賭博事件が相次...
-
釣りと密漁の違いは?知らなかったでは済まされない?事前にできることは?
知らなかったでは済まされないのが法律の世界であるが、全てを知ってから何かをするには少々手間がかかるし、最悪始めることすらできずに終わってしまうこともあり得る。教えてgooでも「釣りと密漁の境目はどこです...
-
カスハラとクレームの違いは?カスハラの法的責任は?企業がとるべき対応は?
東京都が、客からの迷惑行為などを称した「カスタマーハラスメント」、いわゆる「カスハラ」の防止を目的とした条例を、全国で初めて成立させた。条例に罰則はなく、2025年4月1日から施行される。 この動きは自治体...
-
なぜ批判コメントをするの?その心理と向き合い方をカウンセラーにきいた!
今や生活に必要不可欠となったインターネット。手軽に情報を得られるだけでなく、ネットを介したコミュニケーションも一般的となった。それと同時に顕在化しているのが、他者に対する辛らつな意見だ。ネットニュース...
-
大麻の使用罪がなかった理由や法改正での変更点、他国との違いを弁護士が解説
ドイツで2024年4月に大麻が合法化され、その2ヶ月後にサッカーEURO2024が行われた。その際、ドイツ警察は大会運営における治安維持の一つの方針として「アルコールを飲んでいるグループと、大麻を吸っているグループ...
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
テキストファイルで提出とは?
-
Perlのエラーについてご教授く...
-
画像が表示でnull; this.src
-
Perlで同じフォルダにある任意...
-
bashスクリプト
-
perlで2次元配列をサブルーチ...
-
perlについての質問
-
perl このテキストファイルを簡...
-
Strawberry Perl for Windows ...
-
秀丸での一括変換について
-
perl LWPでURLにアクセスした時...
-
どこがおかしいのか教えてくだ...
-
perl の open について教えてく...
-
Perl言語について。
-
ファイルをディレクトリ分配の...
-
アルファベットに付いて質問し...
-
#!/usr/bin/perlで書きだしたCG...
-
perlのflock関数でロックをかけ...
-
AI sisterとは、偽物の人ですか?
-
ファイルアイコンの左下に緑の□...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Perlで定義済みの関数名を使っ...
-
Perl/TkでURLを既定のブラウザ...
-
TwitterAPI1.1でGetメソッド(...
-
mechanizeのタイムアウト処理に...
-
Win32でInputBoxを実装するには?
-
Perlでのselfの書き方
-
正規表現で指定範囲の文字列の取得
-
Perl webのテキストボックスに...
-
perlでのポインタの使い方
-
例外のキャッチ方法
-
Perl での XML 処理での DTD 宣...
-
Perl 強制終了の回避について
-
perlでhtmlファイルを取得した...
-
Perl/Tk Entry に対して見出し...
-
Perl LWPでのIPv6エラー
-
PerlのWeb::Scraperと正規表現...
-
web文書を取得するプログラムの...
-
Web::Scraperの使い方で
-
wikipediaのAPIの取り込みについて
-
正規表現でURLを抽出するには。
おすすめ情報