EXCELで作ったテキストデータ(SJIS)をPHPで読み込んでUTF-8でDBへ書き込むという処理をしたいのですが、一部どうしても文字化けしてしまう文字("l(リットル)"と"II")があり困っています。
具体的には、data.dat(SJIS)を、
hoge.php(UTF-8)で、
$data = mb_convert_encoding(file_get_contents("data.dat"),"UTF-8","auto");
というようにしています。
テキストデータはSJIS、DBへはUTF-8というのは変えられません。
なにかよい方法はないでしょうか?
No.2ベストアンサー
- 回答日時:
リットルって筆記体の小文字のエル、UTF-8でE2 84 93の文字でしょうか。
もしそうなら、その文字は本当のSJISには存在しない文字なので"?"になってしまうのは当然です。mb_convert_encoding()に与えるエンコーディング名を"auto"や"SJIS"ではなく"SJIS-win"に変えてみてください。
ご回答誠にありがとうございます。
まず、ご指摘のように、エンコーディング名を"SJIS-win"にしてみたところ、"II"は文字化けがなおり、正常になりました。
リットルは、おっしゃるように、筆記体の"l"です。根本的に不可能ということは理解しました。
ただ、クライアントからの強い要望でどうしても筆記体のlを表示する必要があるため、
UTF-8に変換する前に"?"を"<<<L>>>"に置き換え → UTF-8に変換 → "<<<L>>>"を"筆記体のl"に置き換え
という、化けるのはリットルだけという前提のとりあえずな方法でひとまずうまくいきました。
出来ればもっとスマートな方法があればいいなと思うのですが、なにかいい案がございましたら参考までにお聞かせ願えればと思います。
No.5
- 回答日時:
#3,4です。
何度もすいません・・・・・このページでは文字参照が数字しか変換されないみたい・・・
リットル を & #8467; とEXCELに入れてもらって引き込むという手もあります。
&と#の間の空白は取ってください。
No.4
- 回答日時:
#3です。
最後の行の
リットル を ℓ とEXCELに入れてもらって引き込むという手もあります。
ですが、
リットル を &#8467; とEXCELに入れてもらって引き込むという手もあります。
です。
文字参照が変換されてしまいました(^^;;
No.3
- 回答日時:
リットル 等SJISに無い文字を保存する場合は
Unicodeテキスト(*.txt)
形式で保存してもらうのはどうでしょうか?
そして、UTF-8への変換時にSJISとUTF-16LE両方に対応しておけば
一応は リットル なども引き込めると思います。
$data = mb_convert_encoding(file_get_contents("data.dat"),"UTF-8","SJIS,UTF-16LE");
引き込んだデータをHTMLとして表示するのであれば、文字参照を利用して
リットル を ℓ とEXCELに入れてもらって引き込むという手もあります。
詳しいご回答ありがとうございます。
Unicodeテキストで保存する方法を試しましたがダメなようです。
文字参照については、クライアント側で文字参照で入力してもらうのは困難なため断念しました。
今回はN0.2の方にお礼した方法でとりあえず行きたいと思います。
どうもありがとうございました。
No.1
- 回答日時:
こんばんは。
$data = mb_convert_encoding(file_get_contents("data.dat"),"UTF-8","auto");
を
$data = mb_convert_encoding(file_get_contents("data.dat"),"UTF-8","SJIS");
にしたらどうですかね?
autoは
ASCII,JIS,UTF-8,EUC-JP,SJIS
の順で照合しますから、SJISの前に引っ掛かっているような・・・。
この回答への補足
早速のご回答ありがとうございます。
お恥ずかしながら引数の意味もあまりわからないまま使っていました。
ひとつ勉強になりました。
しかし今回は残念ながらうまくいきませんでした(同じ結果でした)
試しに変換する前にprintしてみたら、"II"は"II"リットルは"?"と表示されました。
変換後はどちらも"?"です。
ちなみに、WordpressのDBに直接書きこむのですが、投稿画面から入力した物に関してはリットルもIIもちゃんとそのままDBに入っています。
引き続き何か心当たりがございましたらお願いいたします。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・あなたの人生で一番ピンチに陥った瞬間は?
- ・初めて見た映画を教えてください!
- ・今の日本に期待することはなんですか?
- ・【大喜利】【投稿~1/31】『寿司』がテーマの本のタイトル
- ・集中するためにやっていること
- ・テレビやラジオに出たことがある人、いますか?
- ・【お題】斜め上を行くスキー場にありがちなこと
- ・人生でいちばんスベッた瞬間
- ・コーピングについて教えてください
- ・あなたの「プチ贅沢」はなんですか?
- ・コンビニでおにぎりを買うときのスタメンはどの具?
- ・おすすめの美術館・博物館、教えてください!
- ・【お題】大変な警告
- ・【大喜利】【投稿~1/20】 追い込まれた犯人が咄嗟に言った一言とは?
- ・洋服何着持ってますか?
- ・みんなの【マイ・ベスト積読2024】を教えてください。
- ・「これいらなくない?」という慣習、教えてください
- ・今から楽しみな予定はありますか?
- ・AIツールの活用方法を教えて
- ・最強の防寒、あったか術を教えてください!
- ・【大喜利】【投稿~1/9】 忍者がやってるYouTubeが炎上してしまった理由
- ・歳とったな〜〜と思ったことは?
- ・モテ期を経験した方いらっしゃいますか?
- ・好きな人を振り向かせるためにしたこと
- ・スマホに会話を聞かれているな!?と思ったことありますか?
- ・それもChatGPT!?と驚いた使用方法を教えてください
- ・見学に行くとしたら【天国】と【地獄】どっち?
- ・これまでで一番「情けなかったとき」はいつですか?
- ・この人頭いいなと思ったエピソード
- ・あなたの「必」の書き順を教えてください
- ・14歳の自分に衝撃の事実を告げてください
- ・人生最悪の忘れ物
- ・あなたの習慣について教えてください!!
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
SJISで取得した半角カナをUTF-8...
-
PostgreSQLからCSV形式でエクス...
-
小さいひらがな(っ、ょ、ぃ、ゃ...
-
文字化け変換方法
-
mb_send_mailで、半角スペース...
-
PHP+Postgres 「髙」が文字化け
-
SJISからUTFに変換して...
-
includeファイルの文字コードに...
-
mb_ereg_replaceに関して
-
SJIS→UTF-8変換後の文字化けに...
-
VBAのコマンドボタンの文字列の...
-
LaTeX: captionの中で改行した...
-
メッセージボックスで1025文字...
-
全角括弧と全角読点の間隔を狭...
-
ソースコードの1行が長いとき...
-
エスケープ文字の復帰(¥r)と...
-
【VBA】エクセルで最後の不要な...
-
改行について
-
半角記号、全角記号を含む正規...
-
エクセルのCOUNTIFが正しくカウ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
文字化け変換方法
-
SJISで取得した半角カナをUTF-8...
-
UTF8メールがLotus Notesで文字...
-
SQL Serverで文字コードUTF-8
-
PostgreSQLからCSV形式でエクス...
-
PHPスクリプトでエンコードエラー
-
PHPmailerでの添付ファイルの文...
-
PHP+Postgres 「髙」が文字化け
-
記号だけの文字化け対応について
-
SJIS→UTF-8変換後の文字化けに...
-
メールのCCに複数のアドレスを...
-
mail()で送信したメールのタイ...
-
Gmailへのメール送信で文字化け
-
ASCII文字列をEUCなどに変換し...
-
postの文字化け防止について
-
php自動返信メール本文の一部の...
-
phpMyAdmin内での文字化け
-
mb_strposについて予定外の結果...
-
【PHP】mb_convert_encoding...
-
PHPでのメール差出人名について
おすすめ情報