サイトHTMLをWebBrowserを使用せずに取得するために、
Dim stream As System.IO.Stream = client.OpenRead(tbItemURL.Text)
Dim reader As New System.IO.StreamReader(stream)
Dim strHtml = reader.ReadToEnd()
reader.Close()
stream.Close()
のような形で文字列を取得しています。
しかし、この場合Sift-jis等の場合、後の作業(一部データ取得)で文字化けに悩まされます。
http://dobon.net/vb/dotnet/string/detectcode.html
上記サイトで「バイト配列」に格納して判別する方法があります。
そこで、文字列をバイト配列に格納しようとしますが…。
文字列→バイト配列には文字コードが必要となります。
Dim data() As Byte = Encoding.UTF8.GetBytes(text)
なんだか鶏と卵のような感じになってしまいます。
文字列から文字コードを判別する方法はないでしょうか?
よろしくお願いします。
No.2ベストアンサー
- 回答日時:
#1 Wizard_Zeroです。
すみません、ちゃんとテストしないで投稿してしまいました。以下、修正したコードです。
srmBuffの内容を全てメモリストリームへコピーしてバイト配列を得るようにしました。
Dim client As New Net.WebClient
Dim srmBuff As IO.Stream = client.OpenRead("http://hoge")
Dim bytBuff As Byte() = {}
Using srmMemory As New IO.MemoryStream
Dim bytRead As Byte() = {}, intRead As Integer = 0
Call Array.Resize(bytRead, 1024)
intRead = srmBuff.Read(bytRead, 0, bytRead.Length)
Do While intRead > 0
Call srmMemory.Write(bytRead, 0, intRead)
intRead = srmBuff.Read(bytRead, 0, bytRead.Length)
Loop
bytBuff = srmMemory.ToArray
End Using
No.1
- 回答日時:
StreamReaderではなく、IO.Streamから直接バイト配列で読んでしまえばOKです。
Dim client As New Net.WebClient
Dim srmBuff As IO.Stream = client.OpenRead("http://hoge")
Dim bytBuff As Byte() = {}
Array.Resize(bytBuff, CInt(srmBuff.Length))
srmBuff.Read(bytBuff, 0, bytBuff.Length)
このようにすればアクセスしたWebサイトのHTMLをバイト配列で取得することができます。
この回答への補足
回答ありがとうございます。
Wizard_Zeroさんのご指摘の通り、
1)byteで読み込む
2)エンコードをチェックする
3)文字列に変換する
という流れが良さそうです。
コードを利用させていただきましたが、srmBuff.Lengthのところで、
"このストリームはシーク操作をサポートしません。"
というエラーが発生してしまいます。
google検索してもヒット1件だけで、解決策を導き出せませんでした。
解決策がありましたら、よろしくお願いします。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
VBA 変数名に変数を使用したい。
-
Excelのメモリ(配列)の上限は2G...
-
配列をランダムに並び替えても...
-
配列の中の最大値とそのインデ...
-
Excel2010のinputboxで複数デー...
-
構造体配列の特定のメンバーをF...
-
VBAで配列引数を値渡しできない...
-
配列のペースト出力結果の書式...
-
ExcelVBAで配列をベースに配列...
-
構造体配列内の文字列検索のよ...
-
二分探索について
-
EXCELを使って、アクセスログを...
-
COBOLの基本的な事なので...
-
2次元配列の初期値
-
VBAのワークシート関数で配列の...
-
Redim とEraseの違いは?
-
CheckBoxの配列化
-
デバイスマネージャーの一覧取得
-
構造体配列の一部初期化!!!
-
INT64対応のprintf系関数はあり...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
VBA 変数名に変数を使用したい。
-
C#でbyte配列から画像を表示さ...
-
vba フィルター 複数条件 3つ以...
-
エクセルでXY座標に並べられた...
-
Dir関数で読み取り順を操作でき...
-
Excel2010のinputboxで複数デー...
-
構造体配列の特定のメンバーをF...
-
Redim とEraseの違いは?
-
配列のペースト出力結果の書式...
-
COBOLの基本的な事なので...
-
大量の変数を定義するにはどう...
-
DBから取得した値を配列へ代入する
-
EXCEL VBAの課題です
-
VBScriptでCSVファイルを読み出...
-
VBAでMODE関数をつくる
-
配列の中の最大値とそのインデ...
-
定数配列の書き方
-
構造体配列内の文字列検索のよ...
-
CheckBoxの配列化
-
Excelのメモリ(配列)の上限は2G...
おすすめ情報