電子書籍の厳選無料作品が豊富!

現在、javaプログラムで
スペースアルクというオンライン辞書のホームページの
htmlソースを取得するプログラムを作っています。
yahoo japanの時はうまくいったのですが、
このHPの場合、

<font color='#FF9999'>★</font><b>推奨ブラウザについて</b><font color='#FF9999'>★</font><br>
英辞郎をご利用いただく際には、以下の環境をおすすめします。<br>
<br>
・Internet Explorer 5.0以上<br>
・Netscape 6.0以上<br>
<br>
申し訳ありませんが、上記より低いバージョンのブラウザソフトでは、レイアウトや表示・機能が正常に行われません。<br>
なお、以下のサイトから最新のブラウザをダウンロードすることができます。<br>
<br>
<a href="http://www.microsoft.com/japan/ie/" target="_blank">Microsoft Internet Explorer 最新版ダウンロード</a><br>
<a href="http://wp.netscape.com/ja/download/" target="_blank">Netscape ダウンロード</a></td>

というソースが返ってきます。(当然、元のページのソースにはこういうことは書いてないです)      どうすればうまくソースを取得してこれるのか教えてください!

A 回答 (2件)

URLConnection.setRequestProperty("User-Agent", "偽装AGENT");



を使用してHTTP_AGENTを偽装すれば行けそうな気がします。

接続先のURLへ情報を送信し、結果を保存する
http://www.atmarkit.co.jp/fjava/javatips/069java …

参考URL:http://www.atmarkit.co.jp/fjava/javatips/069java …
    • good
    • 0

適切なユーザーエージェントを送ればいいと思います。

    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!