webのログを取っているのですが,
URLデコード -> nkf -s
としています.しかし,URLデコードしたファイルは,google等はutf-8で他はs-jis等で,文字コード(s-jis, euc, utf-8)が混在しているファイルとなってしまいます.
最終的な出力ファイルをs-jisに統一したいと思っています.nkfで行おうとしたところ,どうもうまくいきません.-Xs オプションをつけるとutf-8の部分がちゃんと表示されません.-Wsオプションをつけると今度はs-jis,eucが出力されません.
なにかうまい方法はありませんか?
No.1
- 回答日時:
nkf は utf-8 には対応していなかったのではなかったでしょうか。
iconv コマンドを使いましょう。ただ、iconv の場合変換元コードを
自動判別はしてくれなかったと思います。
$ iconv -f utf-8 -t sjis file.utf8 > file.sjis
参考URL:http://www.google.com/search?hl=ja&inlang=ja&ie= …
No.3ベストアンサー
- 回答日時:
この回答への補足
早速のお返事ありがとうございます.
iconvあたってみます.
iconvでは1行毎にコードが異なるファイルも対応出来ますか?
ところでnkfも2.0以降はunicode対応しているようです.
自己解決(?)したかもしれないので,報告させて頂きます.
理由はわからないのですが,
nkf -Ww | nkf -s
または
nkf -Ww | nkf -Ws
とパイプするとうまくいくようです.
nkf -w | nkf -Ws
nkf -Ws
等はだめです.
-Wwの時だけ動作が違うのでしょうか...
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Excel(エクセル) エクセルのVBAについて とあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
- その他(プログラミング・Web制作) sedの動作 2 2022/10/10 13:38
- その他(プログラミング・Web制作) Sikulix2.0.5(Jython2.7.3)でcsvを読込WEB検索条件にpasteで文字化け 1 2023/03/31 11:02
- UNIX・Linux テキストファイルをページ番号付きでコマンドラインから印刷したい 1 2023/02/22 12:47
- C言語・C++・C# S-JIS → JIS コード変換するには 3 2023/02/09 23:55
- Java VScodeのターミナルの文字化けについて 1 2022/09/27 22:19
- その他(プログラミング・Web制作) python 気象データの取得 2 2023/06/20 23:54
- Excel(エクセル) Excelにて、フォルダ内のTextファイルをマクロで統合すると文字化けしてしまう時の解消コード 4 2023/01/01 07:32
- その他(プログラミング・Web制作) pythonのpandasのcsvの外部結合(outer_join)した際に列が想定とは異なる事象 1 2022/05/25 13:23
- PHP htmlspecialcharsが機能していないです。 バグですか? 1 2022/04/05 01:22
このQ&Aを見た人はこんなQ&Aも見ています
関連するカテゴリからQ&Aを探す
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
テキストファイルをページ番号...
-
メモ帳での一括たて列選択
-
windowsのメモ帳からlinuxへコピペ
-
viエディタを使う理由
-
アイコンの名前の改行
-
【文字コード】コピー&ペース...
-
ファイル名の付け方(中央揃え)
-
XMLの表示文字化け
-
編集中にロックのかかるエディ...
-
illustrator cs2「均等配置(最...
-
英語版WindowsでのCSVファイル...
-
hex表示したいのですが・・
-
UTF-8 環境をSJIS化した後の改...
-
インターネットの文字が文字化...
-
FTP 文字化け
-
URLのパラメーラでURLエンコー...
-
RedHatで使えるエディタ
-
Macで簡単に改行を解除したい
-
onedriveの中身を削除したらパ...
-
嫌ってるのに真似してきたりマ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
メモ帳での一括たて列選択
-
【文字コード】コピー&ペース...
-
Macで簡単に改行を解除したい
-
windowsのメモ帳からlinuxへコピペ
-
ブラウザのテキストをコピーし...
-
LinuxMintで,Windows時代に作成...
-
XMLの表示文字化け
-
.batファイル作成 mailto: コ...
-
illustrator cs2「均等配置(最...
-
ubuntuでテキストファイルが開...
-
ファイル名の付け方(中央揃え)
-
ドラッグ&コピー→デスクトップ...
-
MS-DOSテキストファイルっ...
-
掲示板の書き込みの改行
-
RedHatで使えるエディタ
-
テキストで特定の文字列を含む...
-
Linuxで書いたプレーンテキスト...
-
au 携帯のメール(vMessage, .v...
-
テキストファイルをページ番号...
-
文字コードの混在しているファ...
おすすめ情報