
webのログを取っているのですが,
URLデコード -> nkf -s
としています.しかし,URLデコードしたファイルは,google等はutf-8で他はs-jis等で,文字コード(s-jis, euc, utf-8)が混在しているファイルとなってしまいます.
最終的な出力ファイルをs-jisに統一したいと思っています.nkfで行おうとしたところ,どうもうまくいきません.-Xs オプションをつけるとutf-8の部分がちゃんと表示されません.-Wsオプションをつけると今度はs-jis,eucが出力されません.
なにかうまい方法はありませんか?
No.3ベストアンサー
- 回答日時:
この回答への補足
早速のお返事ありがとうございます.
iconvあたってみます.
iconvでは1行毎にコードが異なるファイルも対応出来ますか?
ところでnkfも2.0以降はunicode対応しているようです.
自己解決(?)したかもしれないので,報告させて頂きます.
理由はわからないのですが,
nkf -Ww | nkf -s
または
nkf -Ww | nkf -Ws
とパイプするとうまくいくようです.
nkf -w | nkf -Ws
nkf -Ws
等はだめです.
-Wwの時だけ動作が違うのでしょうか...
No.1
- 回答日時:
nkf は utf-8 には対応していなかったのではなかったでしょうか。
iconv コマンドを使いましょう。ただ、iconv の場合変換元コードを
自動判別はしてくれなかったと思います。
$ iconv -f utf-8 -t sjis file.utf8 > file.sjis
参考URL:http://www.google.com/search?hl=ja&inlang=ja&ie= …
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
このQ&Aを見た人はこんなQ&Aも見ています
関連するカテゴリからQ&Aを探す
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
文字コードの混在しているファ...
-
Apache 文字化けしてWebに表示...
-
メモ帳での一括たて列選択
-
Windows日本語版のテキストファ...
-
テキスト 改行だけの行の一括...
-
Linux,UnixとTera Termの設定に...
-
ubuntuでテキストファイルが開...
-
ファイル名の付け方(中央揃え)
-
エクセルでファイル保存の際に...
-
WinとMacで互換性のあるテキス...
-
Winmerge ファイルの中身は同じ...
-
ファイル名で / (スラッシュ...
-
onedriveの中身を削除したらパ...
-
Windows10 フォルダ内の自動並...
-
コマンドプロンプトによるフォ...
-
教えてください!困ってます。
-
クラリスワークスのファイルを...
-
外字ファイル、eudc.tte と e...
-
scpによるデータ転送後、ディレ...
-
mrl→midファイルへ
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
メモ帳での一括たて列選択
-
Macで簡単に改行を解除したい
-
LinuxMintで,Windows時代に作成...
-
ドラッグ&コピー→デスクトップ...
-
illustrator cs2「均等配置(最...
-
ubuntuでテキストファイルが開...
-
コピー&ペースト時の文字コー...
-
ANCIとは?
-
WinとMacで互換性のあるテキス...
-
【文字コード】コピー&ペース...
-
RedHatで使えるエディタ
-
ファイル名の付け方(中央揃え)
-
MS-DOSテキストファイルっ...
-
テキストファイルをページ番号...
-
テキストファイルの最終行の改...
-
MacでファイルをPDFに一括変換
-
.batファイル作成 mailto: コ...
-
Apache 文字化けしてWebに表示...
-
英語版WindowsでのCSVファイル...
-
UTF-8 環境をSJIS化した後の改...
おすすめ情報