
こんにちは! Perlの漢字コード(UTF8)の扱いについて詳しい方,おしえていただけないでしょうか?
数年前に自作した,ファイル加工用のシェルスクリプトを久しぶりに取り出してみたら,訳が分からなくなってしまいました。
シェルスクリプトは,大きなファイル(文字コードはUTF-8)の中から特定の表現を削って小さくする物で,例えば次のような行が並んでいます。
perl -pe 's/\343\200\220\.*?\343\200\201//g' | \
困っているのは,文字コードをどうやって決めたか思い出せない点にあります。
新しい記述を足したいのですが,文字コードの指定の方法をすっかり忘れているのに気付いて,呆然としているところです。
以前はネット上にある,どこかのエンコーダーを使ったように記憶していますが。
うまく見つけらずにいます。
ご存じの方,ご教示いただけると大変ありがたいです。。
(試行錯誤して,UTF-8の16進6桁の漢字コードから,2桁ずつとって10進に直す,のは違うらしいことが分かりました。(;^_^A)
No.1ベストアンサー
- 回答日時:
最近のPerl(5.8以降?)だったら、このような「3バイト」ではなく「1文字」として処理する方法があります。
こういう1ラインな書き方だとちょっとめんどうですが。
http://www.rwds.net/kuroita/program/Perl_unicode …
> 2桁ずつとって10進に
\343 など、3桁の数字 は8進数です
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
正規表現 \\s が、\\n に、ヒ...
-
perlのgrepで日本語の処理でエ...
-
機種依存文字定義エラーを回避...
-
例外処理のフローチャートの記...
-
Excel VBAでリンク切れをチェッ...
-
VBSがコンパイルエラーになりま...
-
Sub Workbook_Open()でユーザー...
-
「デバイスは PRN を初期化でき...
-
標準モジュールを削除したい。(...
-
実行中のcpan processを終了さ...
-
モジュールとクラスの違いって...
-
オフコン(富士通Kシリーズ)...
-
Attempt to free unreferenced ...
-
VBA This Workbookモジュール...
-
perlからmysqlに接続できない
-
VBAで旧字体を異字体に一括で変...
-
Excel VBA 定義されたプロージ...
-
Excel VBAで、ユーザーフォーム...
-
VBAで2重のDoLoop関数から抜け...
-
「Perl Command Line InterPret...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
perl で 64ビットint を扱うには?
-
formに「蘭」という文字を入れ...
-
文字列を複数行の先頭にいれた...
-
Perlのコードを隠蔽する
-
perl 漢字コードの書き方,エン...
-
例外処理のフローチャートの記...
-
「デバイスは PRN を初期化でき...
-
エクセルVBAでシートモジュール...
-
Excel VBAで、ユーザーフォーム...
-
ユーザー定義関数に#NAME?が返...
-
Excel VBAで、ユーザーフォー...
-
VBAで別モジュールへの変数の受...
-
Excel VBA 定義されたプロージ...
-
Excel VBAでリンク切れをチェッ...
-
VBでグローバル変数を宣言するには
-
標準モジュールを削除したい。(...
-
VBSがコンパイルエラーになりま...
-
vba userFormのSubを標準モジュ...
-
モジュールからフォームのボタ...
-
モジュールの最大数はいくつな...
おすすめ情報