
EXCELで作ったテキストデータ(SJIS)をPHPで読み込んでUTF-8でDBへ書き込むという処理をしたいのですが、一部どうしても文字化けしてしまう文字("l(リットル)"と"II")があり困っています。
具体的には、data.dat(SJIS)を、
hoge.php(UTF-8)で、
$data = mb_convert_encoding(file_get_contents("data.dat"),"UTF-8","auto");
というようにしています。
テキストデータはSJIS、DBへはUTF-8というのは変えられません。
なにかよい方法はないでしょうか?
No.2ベストアンサー
- 回答日時:
リットルって筆記体の小文字のエル、UTF-8でE2 84 93の文字でしょうか。
もしそうなら、その文字は本当のSJISには存在しない文字なので"?"になってしまうのは当然です。mb_convert_encoding()に与えるエンコーディング名を"auto"や"SJIS"ではなく"SJIS-win"に変えてみてください。
ご回答誠にありがとうございます。
まず、ご指摘のように、エンコーディング名を"SJIS-win"にしてみたところ、"II"は文字化けがなおり、正常になりました。
リットルは、おっしゃるように、筆記体の"l"です。根本的に不可能ということは理解しました。
ただ、クライアントからの強い要望でどうしても筆記体のlを表示する必要があるため、
UTF-8に変換する前に"?"を"<<<L>>>"に置き換え → UTF-8に変換 → "<<<L>>>"を"筆記体のl"に置き換え
という、化けるのはリットルだけという前提のとりあえずな方法でひとまずうまくいきました。
出来ればもっとスマートな方法があればいいなと思うのですが、なにかいい案がございましたら参考までにお聞かせ願えればと思います。
No.5
- 回答日時:
#3,4です。
何度もすいません・・・・・このページでは文字参照が数字しか変換されないみたい・・・
リットル を & #8467; とEXCELに入れてもらって引き込むという手もあります。
&と#の間の空白は取ってください。
No.4
- 回答日時:
#3です。
最後の行の
リットル を ℓ とEXCELに入れてもらって引き込むという手もあります。
ですが、
リットル を &#8467; とEXCELに入れてもらって引き込むという手もあります。
です。
文字参照が変換されてしまいました(^^;;
No.3
- 回答日時:
リットル 等SJISに無い文字を保存する場合は
Unicodeテキスト(*.txt)
形式で保存してもらうのはどうでしょうか?
そして、UTF-8への変換時にSJISとUTF-16LE両方に対応しておけば
一応は リットル なども引き込めると思います。
$data = mb_convert_encoding(file_get_contents("data.dat"),"UTF-8","SJIS,UTF-16LE");
引き込んだデータをHTMLとして表示するのであれば、文字参照を利用して
リットル を ℓ とEXCELに入れてもらって引き込むという手もあります。
詳しいご回答ありがとうございます。
Unicodeテキストで保存する方法を試しましたがダメなようです。
文字参照については、クライアント側で文字参照で入力してもらうのは困難なため断念しました。
今回はN0.2の方にお礼した方法でとりあえず行きたいと思います。
どうもありがとうございました。
No.1
- 回答日時:
こんばんは。
$data = mb_convert_encoding(file_get_contents("data.dat"),"UTF-8","auto");
を
$data = mb_convert_encoding(file_get_contents("data.dat"),"UTF-8","SJIS");
にしたらどうですかね?
autoは
ASCII,JIS,UTF-8,EUC-JP,SJIS
の順で照合しますから、SJISの前に引っ掛かっているような・・・。
この回答への補足
早速のご回答ありがとうございます。
お恥ずかしながら引数の意味もあまりわからないまま使っていました。
ひとつ勉強になりました。
しかし今回は残念ながらうまくいきませんでした(同じ結果でした)
試しに変換する前にprintしてみたら、"II"は"II"リットルは"?"と表示されました。
変換後はどちらも"?"です。
ちなみに、WordpressのDBに直接書きこむのですが、投稿画面から入力した物に関してはリットルもIIもちゃんとそのままDBに入っています。
引き続き何か心当たりがございましたらお願いいたします。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Excel(エクセル) エクセルのVBAについて とあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
- Excel(エクセル) 文字化け。メモ帳でUTF-8に変換後、エクセルへ貼り付けたいです。 3 2022/08/14 07:21
- PHP phpのメールフォームの完了画面でメール受信のコードを書いています。 1 2023/05/31 11:39
- AJAX JavascriptからPHPへのAjax通信でnullが返ってくる 3 2022/08/03 22:00
- その他(プログラミング・Web制作) pythonのこのエラーがわかりません 3 2022/11/16 14:54
- HTML・CSS <meta charset="utf-8"><!-- 文字化け防止ユニコード --> ?最近モバイル 1 2022/12/11 04:27
- PHP PostgreSQLからCSV形式でエクスポートする際にカラム内の改行をとる方法 1 2023/02/22 10:05
- その他(プログラミング・Web制作) Sikulix2.0.5(Jython2.7.3)でcsvを読込WEB検索条件にpasteで文字化け 1 2023/03/31 11:02
- Excel(エクセル) PHPプログラムをエクセルに張り付けると検索ボックスがでてくる! 3 2022/05/08 07:10
- その他(プログラミング・Web制作) データ解析ソフトRでのファイル入力read.csvがエラーになります 7 2022/03/27 22:11
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
文字化け変換方法
-
記号全削除のクラスを作成したい
-
PostgreSQLからCSV形式でエクス...
-
SJIS→UTF-8変換後の文字化けに...
-
VBAのコマンドボタンの文字列の...
-
全角括弧と全角読点の間隔を狭...
-
メッセージボックスで1025文字...
-
ソースコードの1行が長いとき...
-
最終行の改行について
-
エクセルのCOUNTIFが正しくカウ...
-
文字の入力で横バー上段、中断...
-
ダブルコーテーション(
-
エスケープ文字の復帰(¥r)と...
-
VBAでCSVをExcelに取り込む時に...
-
c# string型の変数に、ダブルク...
-
jsp 改行コードで改行させて表...
-
秀丸の正規表現で複数行にわた...
-
改行コードについて
-
SPREADで全角文字の半角...
-
PHPで<a>タグ内からURLと文字を...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
文字化け変換方法
-
SQL Serverで文字コードUTF-8
-
mail()で送信したメールのタイ...
-
SJISで取得した半角カナをUTF-8...
-
PostgreSQLからCSV形式でエクス...
-
RSSを取得すると文字化けする。
-
PHP cURLでPOSTした値が文字化...
-
SJIS→UTF-8変換後の文字化けに...
-
mb_regex_encodingでエンコード...
-
UTF8メールがLotus Notesで文字...
-
postの文字化け防止について
-
phpフォームで携帯へメール送信...
-
2つの検索フォームのリーベン...
-
メールのCCに複数のアドレスを...
-
mb_send_mailで、半角スペース...
-
mb_convert_encoding で 一部の...
-
Gmailへのメール送信で文字化け
-
PHPアクセスログ バッチ処理
-
PHPでのメール差出人名について
-
mb_ereg_replace での文字変換
おすすめ情報