EXCELで作ったテキストデータ(SJIS)をPHPで読み込んでUTF-8でDBへ書き込むという処理をしたいのですが、一部どうしても文字化けしてしまう文字("l(リットル)"と"II")があり困っています。
具体的には、data.dat(SJIS)を、
hoge.php(UTF-8)で、
$data = mb_convert_encoding(file_get_contents("data.dat"),"UTF-8","auto");
というようにしています。
テキストデータはSJIS、DBへはUTF-8というのは変えられません。
なにかよい方法はないでしょうか?
No.2ベストアンサー
- 回答日時:
リットルって筆記体の小文字のエル、UTF-8でE2 84 93の文字でしょうか。
もしそうなら、その文字は本当のSJISには存在しない文字なので"?"になってしまうのは当然です。mb_convert_encoding()に与えるエンコーディング名を"auto"や"SJIS"ではなく"SJIS-win"に変えてみてください。
ご回答誠にありがとうございます。
まず、ご指摘のように、エンコーディング名を"SJIS-win"にしてみたところ、"II"は文字化けがなおり、正常になりました。
リットルは、おっしゃるように、筆記体の"l"です。根本的に不可能ということは理解しました。
ただ、クライアントからの強い要望でどうしても筆記体のlを表示する必要があるため、
UTF-8に変換する前に"?"を"<<<L>>>"に置き換え → UTF-8に変換 → "<<<L>>>"を"筆記体のl"に置き換え
という、化けるのはリットルだけという前提のとりあえずな方法でひとまずうまくいきました。
出来ればもっとスマートな方法があればいいなと思うのですが、なにかいい案がございましたら参考までにお聞かせ願えればと思います。
No.5
- 回答日時:
#3,4です。
何度もすいません・・・・・このページでは文字参照が数字しか変換されないみたい・・・
リットル を & #8467; とEXCELに入れてもらって引き込むという手もあります。
&と#の間の空白は取ってください。
No.4
- 回答日時:
#3です。
最後の行の
リットル を ℓ とEXCELに入れてもらって引き込むという手もあります。
ですが、
リットル を &#8467; とEXCELに入れてもらって引き込むという手もあります。
です。
文字参照が変換されてしまいました(^^;;
No.3
- 回答日時:
リットル 等SJISに無い文字を保存する場合は
Unicodeテキスト(*.txt)
形式で保存してもらうのはどうでしょうか?
そして、UTF-8への変換時にSJISとUTF-16LE両方に対応しておけば
一応は リットル なども引き込めると思います。
$data = mb_convert_encoding(file_get_contents("data.dat"),"UTF-8","SJIS,UTF-16LE");
引き込んだデータをHTMLとして表示するのであれば、文字参照を利用して
リットル を ℓ とEXCELに入れてもらって引き込むという手もあります。
詳しいご回答ありがとうございます。
Unicodeテキストで保存する方法を試しましたがダメなようです。
文字参照については、クライアント側で文字参照で入力してもらうのは困難なため断念しました。
今回はN0.2の方にお礼した方法でとりあえず行きたいと思います。
どうもありがとうございました。
No.1
- 回答日時:
こんばんは。
$data = mb_convert_encoding(file_get_contents("data.dat"),"UTF-8","auto");
を
$data = mb_convert_encoding(file_get_contents("data.dat"),"UTF-8","SJIS");
にしたらどうですかね?
autoは
ASCII,JIS,UTF-8,EUC-JP,SJIS
の順で照合しますから、SJISの前に引っ掛かっているような・・・。
この回答への補足
早速のご回答ありがとうございます。
お恥ずかしながら引数の意味もあまりわからないまま使っていました。
ひとつ勉強になりました。
しかし今回は残念ながらうまくいきませんでした(同じ結果でした)
試しに変換する前にprintしてみたら、"II"は"II"リットルは"?"と表示されました。
変換後はどちらも"?"です。
ちなみに、WordpressのDBに直接書きこむのですが、投稿画面から入力した物に関してはリットルもIIもちゃんとそのままDBに入っています。
引き続き何か心当たりがございましたらお願いいたします。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Excel(エクセル) エクセルのVBAについて とあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
- Excel(エクセル) 文字化け。メモ帳でUTF-8に変換後、エクセルへ貼り付けたいです。 3 2022/08/14 07:21
- PHP phpのメールフォームの完了画面でメール受信のコードを書いています。 1 2023/05/31 11:39
- AJAX JavascriptからPHPへのAjax通信でnullが返ってくる 3 2022/08/03 22:00
- その他(プログラミング・Web制作) pythonのこのエラーがわかりません 3 2022/11/16 14:54
- HTML・CSS <meta charset="utf-8"><!-- 文字化け防止ユニコード --> ?最近モバイル 1 2022/12/11 04:27
- PHP PostgreSQLからCSV形式でエクスポートする際にカラム内の改行をとる方法 1 2023/02/22 10:05
- その他(プログラミング・Web制作) Sikulix2.0.5(Jython2.7.3)でcsvを読込WEB検索条件にpasteで文字化け 1 2023/03/31 11:02
- Excel(エクセル) PHPプログラムをエクセルに張り付けると検索ボックスがでてくる! 3 2022/05/08 07:10
- その他(プログラミング・Web制作) データ解析ソフトRでのファイル入力read.csvがエラーになります 7 2022/03/27 22:11
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・プリン+醤油=ウニみたいな組み合わせメニューを教えて!
- ・タイムマシーンがあったら、過去と未来どちらに行く?
- ・遅刻の「言い訳」選手権
- ・【大喜利】【投稿~11/12】 急に朝起こしてきた母親に言われた一言とは?
- ・好きな和訳タイトルを教えてください
- ・うちのカレーにはこれが入ってる!って食材ありますか?
- ・好きな「お肉」は?
- ・あなたは何にトキメキますか?
- ・おすすめのモーニング・朝食メニューを教えて!
- ・「覚え間違い」を教えてください!
- ・とっておきの手土産を教えて
- ・「平成」を感じるもの
- ・秘密基地、どこに作った?
- ・【お題】NEW演歌
- ・カンパ〜イ!←最初の1杯目、なに頼む?
- ・一回も披露したことのない豆知識
- ・これ何て呼びますか
- ・初めて自分の家と他人の家が違う、と意識した時
- ・「これはヤバかったな」という遅刻エピソード
- ・これ何て呼びますか Part2
- ・許せない心理テスト
- ・この人頭いいなと思ったエピソード
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・ハマっている「お菓子」を教えて!
- ・【大喜利】【投稿~11/1】 存在しそうで存在しないモノマネ芸人の名前を教えてください
- ・好きなおでんの具材ドラフト会議しましょう
- ・餃子を食べるとき、何をつけますか?
- ・あなたの「必」の書き順を教えてください
- ・ギリギリ行けるお一人様のライン
- ・10代と話して驚いたこと
- ・つい集めてしまうものはなんですか?
- ・自分のセンスや笑いの好みに影響を受けた作品を教えて
- ・【お題】引っかけ問題(締め切り10月27日(日)23時)
- ・大人になっても苦手な食べ物、ありますか?
- ・14歳の自分に衝撃の事実を告げてください
- ・【大喜利】【投稿~10/21(月)】買ったばかりの自転車を分解してひと言
- ・ホテルを選ぶとき、これだけは譲れない条件TOP3は?
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・【コナン30周年】嘘でしょ!?と思った○○周年を教えて【ハルヒ20周年】
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
【PHP】mb_convert_encoding...
-
記号だけの文字化け対応について
-
mb_send_mailの2重投稿を防止し...
-
RSSを取得すると文字化けする。
-
DBからのCSVファイルダウンロード
-
PHPアクセスログ バッチ処理
-
10文字以降は非表示にしたいん...
-
SQL Serverで文字コードUTF-8
-
VBAのコマンドボタンの文字列の...
-
エクセルのCOUNTIFが正しくカウ...
-
メッセージボックスで1025文字...
-
ソースコードの1行が長いとき...
-
エスケープ文字の復帰(¥r)と...
-
<span>を<div>に変更すると S...
-
JavaMail,本文中の改行について
-
文字の入力で横バー上段、中断...
-
改行を読み飛ばす
-
C#の改行について
-
2つ以上の連続する空白文字を除去
-
秀丸の正規表現で複数行にわた...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
文字化け変換方法
-
UTF8メールがLotus Notesで文字...
-
SJISで取得した半角カナをUTF-8...
-
SQL Serverで文字コードUTF-8
-
セッションが文字化け、エンコ...
-
mail()で送信したメールのタイ...
-
PHP+Postgres 「髙」が文字化け
-
Access VBA wiht文での実行時エ...
-
php自動返信メール本文の一部の...
-
mb_convert_encoding で 一部の...
-
SJIS→UTF-8変換後の文字化けに...
-
携帯向けフォームの文字化け
-
sjisの文字化けとその対処方法...
-
送信したメールのタイトルが無...
-
PHP cURLでPOSTした値が文字化...
-
全角の”’¥を半角に変換したい
-
UTF-8サイトを取得しSJISに
-
文字コードを変換したURLを作成...
-
文字コードの検出が正しいかを...
-
mb_send_mailの2重投稿を防止し...
おすすめ情報