
webのログを取っているのですが,
URLデコード -> nkf -s
としています.しかし,URLデコードしたファイルは,google等はutf-8で他はs-jis等で,文字コード(s-jis, euc, utf-8)が混在しているファイルとなってしまいます.
最終的な出力ファイルをs-jisに統一したいと思っています.nkfで行おうとしたところ,どうもうまくいきません.-Xs オプションをつけるとutf-8の部分がちゃんと表示されません.-Wsオプションをつけると今度はs-jis,eucが出力されません.
なにかうまい方法はありませんか?
No.3ベストアンサー
- 回答日時:
この回答への補足
早速のお返事ありがとうございます.
iconvあたってみます.
iconvでは1行毎にコードが異なるファイルも対応出来ますか?
ところでnkfも2.0以降はunicode対応しているようです.
自己解決(?)したかもしれないので,報告させて頂きます.
理由はわからないのですが,
nkf -Ww | nkf -s
または
nkf -Ww | nkf -Ws
とパイプするとうまくいくようです.
nkf -w | nkf -Ws
nkf -Ws
等はだめです.
-Wwの時だけ動作が違うのでしょうか...
No.1
- 回答日時:
nkf は utf-8 には対応していなかったのではなかったでしょうか。
iconv コマンドを使いましょう。ただ、iconv の場合変換元コードを
自動判別はしてくれなかったと思います。
$ iconv -f utf-8 -t sjis file.utf8 > file.sjis
参考URL:http://www.google.com/search?hl=ja&inlang=ja&ie= …
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
このQ&Aを見た人はこんなQ&Aも見ています
関連するカテゴリからQ&Aを探す
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
LinuxMintで,Windows時代に作成...
-
メモ帳での一括たて列選択
-
Linuxで書いたプレーンテキスト...
-
Macで簡単に改行を解除したい
-
メモ帳の出力形式
-
MS-DOSテキストファイルっ...
-
アイコンの名前の改行
-
.batファイル作成 mailto: コ...
-
テキストファイルをページ番号...
-
r\\ command not found
-
FTP 文字化け
-
photoshopのデータが勝手にクリ...
-
エディタで、文章中の空白やタ...
-
ファイル名の付け方(中央揃え)
-
windowsのメモ帳からlinuxへコピペ
-
見下されるとかマウント取るとか
-
Winmerge ファイルの中身は同じ...
-
嫌ってるのに真似してきたりマ...
-
Excelで保存時間とPCの時間があ...
-
onedriveの中身を削除したらパ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Macで簡単に改行を解除したい
-
LinuxMintで,Windows時代に作成...
-
メモ帳での一括たて列選択
-
【文字コード】コピー&ペース...
-
XMLの表示文字化け
-
ドラッグ&コピー→デスクトップ...
-
WinとMacで互換性のあるテキス...
-
メモ帳の出力形式
-
xcodeで改行が。。
-
ソースが文字化けして困ってます。
-
英語版WindowsでのCSVファイル...
-
異なるOSのファイルがなぜ読め...
-
Linuxのテキストファイルについて
-
photoshopのデータが勝手にクリ...
-
コピー&ペースト時の文字コー...
-
MS-DOSテキストファイルっ...
-
掲示板の書き込みの改行
-
ANCIとは?
-
windowsのメモ帳からlinuxへコピペ
-
au 携帯のメール(vMessage, .v...
おすすめ情報