プロが教える店舗&オフィスのセキュリティ対策術

VB.net で Webbrowserコントロールで特定のURLを読み込んでいます。
表示されているのはHTMLタグも含まずXMLでもなく
ただの文字列です。

この文字列全体を取得するにはどうすればよろしいでしょうか?

A 回答 (1件)

WebBrowserのDocuemntStreamからデータを引き出して


適切なエンコーディングをかけてやればVBが理解できる文字列になりますよ

dim strm as System.IO.StreamReader
dim enc as System.Text.Encoding
dim sb as System.Text.StringBuilder

enc = System.Text.Encoding.GetEncoding("shift-jis)
strm = new System.IO.StreamReader( WebBrowser1.DocumentStream, enc)
do until strm.EndOfStream
  sb.AppendLIne( strm.ReadLine )
Loop
strm.Close
TextBox1.Text = sb.ToString()
といった具合です

enc = System.Text.Encoding.GetEncoding("shift-jis)
などは適宜修正してください

単純なテキストですと
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=shift_jis"></HEAD>
<BODY><PRE>ここに表示されている
ファイルの内容があるはずです
</PRE></BODY></HTML>
といった具合で取得できるので PREタグで囲まれた範囲を抽出すればいいでしょう
    • good
    • 0
この回答へのお礼

今回は上記方法では解決できませんでしたが
いろいろと参考になりましたありがとうございました

お礼日時:2008/12/30 20:03

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!