PHPでタグ取得の動作が非常に重い $html = file_get_contents($url); if(preg_match( "/ (.*?) /i", $html, $match)) { } 上記のような方法で一度に（1ページ内で）30サイトほどのタグを取得すると、不可がかかり、表示までにかなり時間がかかってしまいます。 preg_match では重いのでしょうか。それとも一度に30サイトはそもそも無理があるのでしょうか。。

PHPで<title>タグ取得の動作が非常に重い

解決済

質問者：tkmkok
質問日時：2010/11/05 02:11
回答数：3件

PHPで<title>タグ取得の動作が非常に重い

$html = file_get_contents($url);
if(preg_match( "/<title>(.*?)<\/title>/i", $html, $match)) {
}

上記のような方法で一度に（1ページ内で）30サイトほどの<title>タグを取得すると、不可がかかり、表示までにかなり時間がかかってしまいます。

preg_match では重いのでしょうか。
それとも一度に30サイトはそもそも無理があるのでしょうか。。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (3件)

ベストアンサー優先
最新から表示
回答順に表示

No.2ベストアンサー

回答者： tracer
回答日時：2010/11/05 12:39

取得先のコンテンツ、あるいはサーバー自体が重いとは考えられませんか？たとえば、preg_matchで検索せずに、そのまま読み込むのにどれくらい時間がかかりますか？また、titleタグはheadタグ内にあると決まっているので、バイト数などで読み込む量を制限するといくらかは軽くなるかもしれませんね。

取得先のコンテンツが重いのはどうにもなりませんが、PHPでなくJSの使用が可能であるならば、非同期で取得することで、体感としてはいくらか向上すると思います。

- 0
- 件

通報する

この回答へのお礼

ありがとうございます。

preg_match部分を外して試しても、やはり変わらず重いままでした。

↓そこで、ご指摘のバイト数を調整してみました。
$html = file_get_contents($url, NULL, NULL, 0, 1500);

だいぶ軽くなりました。
今で普通に重いサイトだなぁ、くらいの体感です。。

後はAjaxにする方法しかないんでしょうかね。

通報する

お礼日時：2010/11/05 14:23

No.3

回答者： tracer
回答日時：2010/11/05 16:45

No2です。

最新の情報を取得しなくてもよいのであれば、定期的(1時間おきくらい)にタイトルを取得するプログラムをつくって、その結果(CSVなど)を読み込むことで、毎回重いのは回避できると思います。いわゆるキャッシュファイルをつくって読み込むということですね。また、1時間おき程度の頻度なら、アクセス毎の取得よりも相手サイトに迷惑がかからないと思いますし、自分のサーバーの負荷も軽減できます。