![](http://oshiete.xgoo.jp/images/v2/pc/qa/question_title.png?5a7ff87)
現在、何らかのhtmlを取得する際にはurf-8で統一しようと思っているのですが、
たとえば
<?php
$f=file_get_contents("http://blog.livedoor.jp/dqnplus/")//文字コードEUC-JP;
$f = mb_convert_encoding($f,"utf-8","eucjp-win,utf-8,sjis-win,EUC-JP");
echo $f;
?>
では、EUC-JPからの変換がうまくいきません。
……というより、EUC-JPのエンコーディングのみ失敗してしまいます。
(文字化けしたもののみ抽出すると、すべてEUC-JPでした)
どのようなコードを書けば、正常にエンコードできるでしょうか。
どなたかご教示のほど、どうかよろしくお願いいたします。
A 回答 (1件)
- 最新から表示
- 回答順に表示
No.2
- 回答日時:
>$f = mb_convert_encoding($f,"utf-8","eucjp-win,utf-8,sjis-win,EUC-JP");
とりあえず(そのサイトが)EUC-JPであることが既知なら
$f = mb_convert_encoding($f,"utf-8","eucjp-win");
と決め打ちしてもいいと思います。EUC-JP/eucjp-win以外でdetectされたって困るだけですから。
もし『どのサイトも同じロジックでやりたい』ということであれば、httpレスポンスヘッダのcharsetを確認すべきですし、それが存在しなかったらhtmlソース内のmeta要素を拾うようにすべきです(ブラウザもこの順番で行っているハズです)。
http://www.php.net/manual/ja/reserved.variables. …
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- PHP PostgreSQLからCSV形式でエクスポートする際にカラム内の改行をとる方法 1 2023/02/22 10:05
- その他(プログラミング・Web制作) 文字コード及びフォントに関する次の記述を読み,適切なものをすべて選べ。 ASCIIとは,英数字だけを 4 2023/01/11 19:10
- PostgreSQL PostgressからMySQL(MariaDB)へ構造を変更する際のTimestamp等について 2 2023/04/04 12:09
- PHP phpのメールフォームの完了画面でメール受信のコードを書いています。 1 2023/05/31 11:39
- その他(プログラミング・Web制作) sedの動作 2 2022/10/10 13:38
- Windows 8 メモ帳による文字コード変換 2 2022/09/01 18:38
- Excel(エクセル) エクセルのVBAについて とあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
- PHP phpの imap_search で漢字コード 1 2022/09/06 17:32
- 据え置き型ゲーム機 ゲームのタイトルに “Anniversary” と付くものがあり… 2 2023/05/02 08:13
- その他(教育・科学・学問) IUと単位は、同じですか? 例えば、写真の20単位は、20IUという意味ですか? https://w 1 2023/02/04 18:36
関連するカテゴリからQ&Aを探す
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
POST文字列が化ける(外字)
-
データベースから取り出した日...
-
SJISのダメ字について
-
mail関数を使った際の文字コー...
-
mb_convert_encoding で?になる。
-
XML出力時の日本語一部文字化け
-
Linux + phpで2バイト文字のパ...
-
フォーム受け渡しの際の文字化け
-
PHPでCSV出力時の文字化け(一部)
-
PHPの文字コード (php.iniの...
-
PHPExcelで日本語(漢字)ファ...
-
onedrive にexcelファイルをア...
-
CFileDialogの最初のディレクト...
-
透過PNGが透過されない!!
-
フォームで戻った際に入力済み...
-
別ファイルの変数を呼び出した...
-
PHPのif文でその処理を途中で抜...
-
phpの中でphpを書けないか
-
さくらサーバーにて、phpからメ...
-
リンク先を隠す方法はないでし...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
i18n_convert と mb_convert_e...
-
Content-Typeが機能していない?
-
mb_convert_encoding で?になる。
-
エンコーディングについて
-
scandir関数取得結果の文字化け
-
ハシゴの「高」が「?」に置き...
-
$str=preg_replace('/\\u3000/'...
-
データベースから取り出した日...
-
XML出力時の日本語一部文字化け
-
mysql utf8、php・euc-jp で出...
-
phpのhex2binについてphpで、ut...
-
POST文字列が化ける(外字)
-
PHPの文字化けした文字だけ削除...
-
csvからデータベースへ取り込み...
-
PHPExcelで日本語(漢字)ファ...
-
euc-jpからutf-8の文字コード変...
-
年と曜が文字化け・・・対応策...
-
htaccessでの文字コード設定に...
-
php5,MySQL5で文字化けが起こる
-
windowsXP、XAMPPでメーラーMer...
おすすめ情報