言語はphpです。
アップロードしたファイルをからデータを1行ずつ抜き取るという作業をしています。
その際にエンコードを下記の方法で行っています。
$lines = mb_convert_encoding(fgets($fp), 'utf-8','shift-jis');
この場合、元のファイルがshift-jisであればなんら問題は無いのですが、すべてのファイルがそうとは限りません。なので、アップロードしたファイルの文字コードを調べ、その文字コードを記述するようにしたいのですが、調べる方法は何か無いでしょうか?
※[auto]を試してみましたが、その際は文字化けが起きていましましたので、出来れば他の方法でお願いします。
自分なりに調べてみましたが、良い情報を見つけることが出来なかったので、ご存知の方は宜しくお願い致します。
No.3ベストアンサー
- 回答日時:
ファイルの文字コード統一については、運用周りやユーザ教育で徹底するのが今後のためになります。
しかし、どうしてもプログラム側で対処しなければならないのであれば。たいていのLinuxにはnkfというコマンドが付随しています(無ければ追加でインストール可能)
nkfは文字コード推測及び変換ツールです。
nkf -g ファイル名
にてかなりの正解率で文字コードを推測するのでこれをphpから呼び出すという手です。
参考URLに書いてある通りなのですが、かいつまんで解説すると。
function file_charset ($charset_file_path, $char_set) {
という関数を定義。その関数のなかで
$default_charset = `nkf -g $charset_file_path`;
のように、nkfにファイルの文字コードを判別させて返り値を取得
そして
$file_contents = mb_convert_encoding($file_contents, $char_set, $default_charset);
のように、nkf推測文字コードと出力文字コードを指定してmb_convert_encodingで文字コード変換
てな感じです。
別解:ファイルアップロード成功後、「nkf -w ファイル名」コマンドを実行するようプログラムして強制的にUTF-8に上書き変換、という手もありますね。
参考URLが理解できればこの方法でも組めるようになるでしょう。
お好みで好きな方で。
私だったらこっちにするかな。
参考URL:http://www.omnioo.com/omnioolab/php/post-93.php
ありがとうございます!
うまくいかず長い時間悩んでいたのですが、この方法で解決することができました!
本当に求めていた通りの動きが出来たので大変感謝しています。
あらためてありがとうございました。
No.2
- 回答日時:
1行ごとに調べるのでは誤判別が多くなるでしょうね。
file_get_contentsなどでそれなりの量を読み込んでから判断すべきです。またmb_detect_orderが標準のままだと誤判別の元です(私の環境だと標準の状態で判別出来た例しがないです)。キチンと指定してください。
http://jp.php.net/manual/ja/function.mb-detect-o …
#ましてmb_convert_encodingの[auto]はほぼ無意味です(汗
あちこちのサイトにも記述されてましたが、やはり[auto]は無意味なんですね(笑)
また、たくさんのアドバイスありがとうござました!
No.1
- 回答日時:
厳密にいうとないです
よくやられるのは先頭から数キロバイトサンプリングして
特徴的な範囲で文字が現れればその文字コードだと判定することです。
容量の小さいファイルはいずれにしろ難しいですね
ファイルをアップさせるならきちんと仕様を守らせる
というのが最善の対応策です
回答ありがとうございます!
今回はlinuxサーバであったため、上記の方の方法で解決することができました!
ですが、windowsサーバだったら無いのでしょうね・・・。
確かに仕様を決めることが一番の解決策かもしれませんね。
ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Excel(エクセル) エクセルのVBAについて とあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
- Excel(エクセル) Excelにて、フォルダ内のTextファイルをマクロで統合すると文字化けしてしまう時の解消コード 4 2023/01/01 07:32
- UNIX・Linux テキストファイルをページ番号付きでコマンドラインから印刷したい 1 2023/02/22 12:47
- PHP phpのメールフォームの完了画面でメール受信のコードを書いています。 1 2023/05/31 11:39
- Java VScodeのターミナルの文字化けについて 1 2022/09/27 22:19
- HTML・CSS docxをmht形式で保存したファイルをedgeで開くと文字化けする 1 2022/07/29 13:14
- Google Drive 【Googleドライブ】ドライブ上内でのフォルダ移行について 4 2022/11/30 12:50
- Visual Basic(VBA) 集めたシートのシート名を変更したい。 下記のコードでサブフォルダにあるファイルのSheet3を集めて 6 2022/08/23 10:38
- Visual Basic(VBA) サブフォルダ(データ)にある複数の.xlsxファイルのSheet3のA2セルの値で01から左側をB2 2 2022/08/14 15:46
- 作詞・作曲 或る曲の楽譜のコード進行の中に"F onA"なるものがありました。これはどんな和音ですか? 7 2023/05/22 00:34
関連するカテゴリからQ&Aを探す
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
PHPSpreadsheetを使って関数を...
-
ワードプレスプラグイン MW WP ...
-
ゆゆにゃ。
-
phpでcookieがうまく保存されない
-
csvファイルについて教えて下さ...
-
入力した部分を表示させたまま...
-
htmlで複数の個数入力欄を表示...
-
ここでの ②if($su_d<>"")の比較...
-
Postgresの特定のカラムからス...
-
PHP ページング データベース
-
PHPのセッション有効期限について
-
フォームで戻った際に入力済み...
-
【初心者】XAMPPのapacheの(恐...
-
phpでクラスのメソッドで同名の...
-
PHP8を使うと、大量のWarningが...
-
PHP MySQLに画像を直接保存
-
PHPでの時間の足し算、割り算
-
ファイルアップロードに関して...
-
メールフォームのタイトルが文...
-
重複を防ぐ記述について教えて...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
EclEmmaレポートのエクスポート...
-
PHPで韓国語の表示がうまくいき...
-
PHPExcelバッファへの書き込み...
-
文字コード変えたら、fopenでき...
-
HTTPヘッダはメタタグにも記述...
-
Eclipseで文字化け
-
csvファイル出力時に文字化けし...
-
phpで動的タイトル
-
文字集合範囲外の文字とパーセ...
-
phpログファイルの文字化けにつ...
-
PHPで「®」や特殊文字のエスケープ
-
phpフォームで文字化け
-
Google Chromeで文字化け
-
発生した文字化けに対する対処
-
サーバーにアップすると文字化...
-
GEEKLOG(ギークログ) 文字化け
-
PHP time()に関しての質問です
-
文字化けについて
-
UTF8のページでIEがシフトJISを...
-
batファイルでうまく動かないプ...
おすすめ情報