![](http://oshiete.xgoo.jp/images/v2/pc/qa/question_title.png?5a7ff87)
よろしくお願いします。
PHP であるサイトをスクレイピングしているのですが、str_get_htmlが特定?のページだけ処理が失敗します。
例えば、1ページ~10ページ目までをスクレイピングしているときに、8ページ目だけ失敗します。
str_get_htmlの処理に失敗する原因って何々あるんでしょうか?
以下は、サーバ・PHPの情報になります。
・サーバ:さくらのレンタルサーバ スタンダード
・PHP -v 5.4.22
・ソース
$HTML = file_get_contents($url);
$encode_HTML = mb_convert_encoding($HTML, 'UTF-8', 'CP932');
$Dom = str_get_html($encode_HTML);
// ここで$Domに値がはいっていないのを確認しました。
// print_r($encode_HTML); はHTMLソースにはなってました。
if ($Dom){
echo "OK";
}else{
echo "NG";
continue;
}
No.1ベストアンサー
- 回答日時:
再帰上限の問題でしょうか?
http://tips.recatnap.info/error_recursion_run_10 …
【代替案1: DOMDocument::loadHTMLFile】
http://php.net/manual/ja/domdocument.loadhtmlfil …
$dom = new DOMDocument;
@$dom->loadHTMLFile($url);
【代替案2: preg_match】
http://php.net/manual/ja/function.preg-match.php
こちらは正規表現の知識が必要となります。
結果文字コードの問題でしたw
エンコーディングするとき、cp932→UTF8にしてましたが、
AUTOにしたら上手くいきました。
ありがとうございました。
--参考にしたサイト--
http://tenifre.hatenablog.jp/entry/2013/04/11/PH …
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Excel(エクセル) PHPプログラムをエクセルに張り付けると検索ボックスがでてくる! 3 2022/05/08 07:10
- PHP PHP MySql ページング 2 2022/09/20 06:38
- PHP PHPでCookieを使った訪問回数について 1 2023/05/28 14:10
- PHP PostgreSQLからCSV形式でエクスポートする際にカラム内の改行をとる方法 1 2023/02/22 10:05
- PHP php テーブルが作成できない 1 2022/11/17 23:41
- MySQL php テーブルを作れない 2 2022/11/17 18:22
- PHP PHPでユーザー情報を入力して簡易ログイン機能をつくってみたのですが 1 2023/05/29 08:51
- PHP PHPプログラムの間違い 1 2022/10/06 14:33
- PHP if(preg_match("/[^0-9]/",$gu_d)){意味を教えてください。 1 2022/05/06 05:37
- PHP php ログイン 1 2022/11/01 00:24
関連するカテゴリからQ&Aを探す
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
JSFタグのfタグとは
-
コメントタグに挟まれた部分を...
-
HTMLの許可
-
「ブログのコメント欄にリンク...
-
指定したURIを参照して、ソース...
-
Notice: Undefined offset: 2 ...
-
srcに「banner.」で始まるファ...
-
htmlのソースからテーブルの値...
-
objective-cでのHTMLタグ表示に...
-
横1行に2種類の画像を交互に5...
-
phpの正規表現
-
タグの < > の呼び方。
-
preg_match と正規表現 で URL抽出
-
九九の課題の件です
-
VBAのコマンドボタンの文字列の...
-
文字の入力で横バー上段、中断...
-
REGEXREPLACE関数について、
-
メッセージボックスで1025文字...
-
ソースコードの1行が長いとき...
-
文の改行
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
reuterの記事をbeautiful.soup....
-
変数にHTMLを代入する場合
-
Nvuで作成したhtmlをコピペして...
-
srcに「banner.」で始まるファ...
-
[php][正規表現]タグ以外を削除...
-
PHPの正規表現でHTMLタグの内容...
-
htmlでflashを開く、画面サイズ...
-
csobjというタグについて
-
正規表現でHTMLタグの属性まで...
-
正規表現でタグの置換をしたい...
-
HTMLファイルの書き換え
-
★PHP★フォーム登録時にタグを読...
-
PHP4→5にアップグレードしたら...
-
オリジナルタグをHTMLタグに置...
-
print "<img src=\\"0.jpg\\/>\...
-
Strutsでリンクを動的に生成したい
-
正規表現で複数行に渡る範囲を...
-
PHP Webページのタイトルを取得...
-
リッチテキストエディターでの...
-
MP3のコメントタグやSYLTの詳細
おすすめ情報