Zend_Dom_Queryを使ってHTMLを読み込み、そこで抽出した文字列を
1文字ずつ分解して配列に収める作業を下のプログラムではしているのですが、
得られた配列には空白のような値が入ってきてしまいます・・・
どうやら下の場合は<BODY>~</BODY>間にある改行が原因(改行なしで<BODY>あいう</BODY>なら空白は発生しませんでした)
らしいのですが、文字をmb_substrで分割するときに入り込んでいるようなのです。
その空白をプログラムでマッチさせて消そうとしたのですが、emptyとかnullとかいろいろ試したのですが
その空白にはマッチしないのです・・・
どうやればこの空白を消せることができるのでしょうか?
$doc = <<<EOF
<HTML>
<HEAD>
<META http-equiv="Content-Type" content="text/html; charset=UTF-8">
<TITLE></TITLE>
<BODY>
あいう
</BODY>
</HTML>
EOF;
$dom_query = new Zend_Dom_Query();
$dom_query->setDocument($doc);
$results = $dom_query->query("body");
$arr = array();
foreach ($results as $domelement) {
$str = $domelement->nodeValue;
}
$enc = mb_detect_encoding($str, 'ASCII,JIS,UTF-8,EUC-JP,SJIS');
$res = array();
while ($len = mb_strlen($str, $enc))
{
array_push($res, mb_substr($str, 0, 1, $enc));
$str = mb_substr($str, 1, $len, $enc);
}
print_r($res);//Array ( [0] => [1] => [2] => あ [3] => い [4] => う [5] => [6] => )
//↓マッチしない
if(empty($res[0])) {
unset($res[0]);
}
No.1ベストアンサー
- 回答日時:
思いつきで書いてるので、見当違いな事いってるかもしれません。
その空白を ord() すると なんて出ます?
print ord($res[0]);
empry()自体 使う事がないので 動作が良く分かってないんですけど、空白と認識しない以上は なんか入ってるんだろうなと思うのですが。
あと、trim() してみても一緒ですかね?
ご回答ありがとうございます。
trim() で除去できました!ありがとうございます。
ordの方は、
print ord($res[0]);//13
print ord($res[1]);//10
print ord($res[2]);//227
print ord($res[3]);//227
という結果でした。
この結果からどういうことが推測できるのでしょうか?
No.2
- 回答日時:
> この結果からどういうことが推測できるのでしょうか?
↓アスキーコード表
http://www.cppll.jp/cppreference/ascii.html
227が何かは分かりませんが、13と10は Windowsの改行コードですね。
CRLF とか \r\n とかで表現されるものです。
Linuxだと LFのみ、Macだと CRのみ とかの改行コードだったように記憶してます。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Excel(エクセル) PHPプログラムをエクセルに張り付けると検索ボックスがでてくる! 3 2022/05/08 07:10
- PHP ここでの ②if($su_d<>"")の比較演算子 を使う理由は 1 2022/03/26 02:33
- PHP PHPのエラーの解消法について教えて下さい。 1 2023/02/06 10:48
- PHP php ログイン 1 2022/11/01 00:24
- PHP if(preg_match("/[^0-9]/",$gu_d)){意味を教えてください。 1 2022/05/06 05:37
- CGI htmlからパラメータで、cgiに渡したい。 1 2023/02/06 16:15
- AJAX JavascriptからPHPへのAjax通信でnullが返ってくる 3 2022/08/03 22:00
- PHP htmlspecialcharsが機能していないです。 バグですか? 1 2022/04/05 01:22
- HTML・CSS ボタンをクリックした時に、入力フォームのすぐ下部に、「入力欄が空白です」というテキストメッセージが表 1 2022/04/27 16:25
- PHP PHPプログラムの間違い 1 2022/10/06 14:33
関連するカテゴリからQ&Aを探す
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
VBAのコマンドボタンの文字列の...
-
LaTeX: captionの中で改行した...
-
Excel VBS、ADODB.Streamで改行
-
texのchapterが改行される
-
freadでcsvファイルを読み込ん...
-
エスケープ文字の復帰(¥r)と...
-
エクセルの文字列の抽出方法に...
-
ソースコードの1行が長いとき...
-
ToolTipTextの改行はできないの...
-
mysql_real_escape_stringについて
-
改行が半角スペースに変わる
-
【VBA】エクセルで最後の不要な...
-
「続行するには何かキーを押し...
-
POSTで改行コードを受け渡すには
-
PHPでHTMLメールを送信、文字化...
-
COBOLの改行
-
全角括弧と全角読点の間隔を狭...
-
マクロで半角を全角に
-
PHPで あるフォルダ内の、特定...
-
UTF8メールがLotus Notesで文字...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
VBAのコマンドボタンの文字列の...
-
ソースコードの1行が長いとき...
-
エスケープ文字の復帰(¥r)と...
-
COBOLの改行
-
C++で空Enterの入力を判...
-
改行について
-
ファイルから読み取った改行文...
-
jsp 改行コードで改行させて表...
-
JAVA System.out.println の ...
-
テキストファイルから改行コー...
-
Excel VBAからBeckyを起動して...
-
【VBA】エクセルで最後の不要な...
-
C++でのCRLFについて
-
VBAでCSVをExcelに取り込む時に...
-
改行を読み飛ばす
-
エクセルVBA 文字列領域が不足...
-
JavaMail,本文中の改行について
-
グレープシティのSPREAD...
-
最終行の改行について
-
変数の中の改行コードをBRタグ...
おすすめ情報