VB.net で Webbrowserコントロールで表示しているテキスト全体を取得したい

解決済

質問者：tomoporo
質問日時：2008/12/22 10:34
回答数：1件

VB.net で Webbrowserコントロールで特定のURLを読み込んでいます。
表示されているのはHTMLタグも含まずXMLでもなく
ただの文字列です。

この文字列全体を取得するにはどうすればよろしいでしょうか？

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (1件)

ベストアンサー優先
最新から表示
回答順に表示

No.1ベストアンサー

回答者： redfox63
回答日時：2008/12/22 11:42

WebBrowserのDocuemntStreamからデータを引き出して

適切なエンコーディングをかけてやればVBが理解できる文字列になりますよ

dim strm as System.IO.StreamReader
dim enc as System.Text.Encoding
dim sb as System.Text.StringBuilder

enc = System.Text.Encoding.GetEncoding("shift-jis)
strm = new System.IO.StreamReader( WebBrowser1.DocumentStream, enc)
do until strm.EndOfStream
　　sb.AppendLIne( strm.ReadLine )
Loop
strm.Close
TextBox1.Text = sb.ToString()
といった具合です

enc = System.Text.Encoding.GetEncoding("shift-jis)
などは適宜修正してください

単純なテキストですと
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=shift_jis"></HEAD>
<BODY><PRE>ここに表示されている
ファイルの内容があるはずです
</PRE></BODY></HTML>
といった具合で取得できるので PREタグで囲まれた範囲を抽出すればいいでしょう