Perl5.8で、EUCで保存されたテキストファイルを読み込み、Shift-JISで保存しようとしてます。
EUCからShift-JISへの変換は、Encode.pmを使用しています。
テキストファイルに「髙」(ハシゴ高 0xFCE2)や「﨑」が入っていた場合、変換されたデータは「?」(0x3F)になってしまいます。
「髙」や「﨑」をPerlを使用してEUCからShift-JISする方法はありませんでしょうか?
======================================
use Encode qw/ from_to /;
open IN, "data.txt";
$data = <IN>;
close IN;
from_to( $data, 'euc-jp','shiftjis');
open OUT, ">data2.txt";
print OUT $data;
close OUT;
======================================
宜しくお願いします。
No.2ベストアンサー
- 回答日時:
>Shift-JISの「髙」(0xFBFC ?)に変換したいのですが、どのようにすればよいのでしょうか。
”髙”という文字は、シフトJIS上、\xEEE0と\xFBFCにマッピングされています。
EUC-jpの\xFCE2に相当するのは、領域的には\xEEE0が妥当かと思われます。
ちなみに、nkfで、コード変換すると、\xFCE2 => \xEEE0 で変換されます。
perl標準のencode.pmでがんばるなら、Encode::FB_XMLCREFを使った上で
気に入らない部分を後から、自前コーディングで、気に入るように加工するしか
ないかと思います。
ありがとうございます。
お礼が遅くなってすみません。
jcode.plでも、\xFCE2 => \xEEE0 で変換されました。
特にEncode.pmを使う理由も無いので、jcode.plを使うことにします。
No.1
- 回答日時:
下記のサイトが参考になるかと思います。
http://www.kawa.net/works/jcode/uni-escape.html
ちなみに「髙 Perl」のキーワードでYahoo検索してHITした最初のサイトです。
検索を有効利用すればすぐに分かることもあるのでちょっと試してみては如何でしょうか。
参考URL:http://www.kawa.net/works/jcode/uni-escape.html
この回答への補足
ありがとうございます。
教えていただいたサイトは、すでに見ていますが、それでも分からなかったので、ここに質問しました。
すみません、そのことを書いてなかったですね。ごめんなさい。
教えていただいたサイトのようにすると、以下のような結果になります。
from_to( $data, 'euc-jp','shiftjis', Encode::FB_XMLCREF );
【結果】(テキストファイル)
郄
Shift-JISの「髙」(0xFBFC ?)に変換したいのですが、どのようにすればよいのでしょうか。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
このQ&Aを見た人はこんなQ&Aも見ています
-
ゆるやかでぃべーと タイムマシンを破壊すべきか。
これはディベートの論題だと仮定したうえでの回答お願いします。あなたは、その末にタイムマシンを壊してしまうのか、使い道を探すのかどうかを考えてもらいたいです。
-
フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
あなたが普段思っている「これまだ誰も言ってなかったけど共感されるだろうな」というあるあるを教えてください
-
映画のエンドロール観る派?観ない派?
映画が終わった後、すぐに席を立って帰る方もちらほら見かけます。皆さんはエンドロールの最後まで観ていきますか?
-
海外旅行から帰ってきたら、まず何を食べる?
帰国して1番食べたくなるもの、食べたくなるだろうなと思うもの、皆さんはありますか?
-
天使と悪魔選手権
悪魔がこんなささやきをしていたら、天使のあなたはなんと言って止めますか?
-
Perlからメール送信で文字化け
Perl
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
Excel VBAでPDFファイルをMicro...
-
CString から LPCTSTRの型に変換
-
文字コードの%E3%80%とは何です...
-
SJIS->UTF8->SJISコード変換に...
-
日本語→ギリシャ語翻訳サイト
-
文字コード(多言語化?)の取り...
-
ExcelのVBAで・・・
-
マンセル表色系からRGB表色系へ...
-
エクセルでの漢字(全角ひらが...
-
文字化けしてしまって困っています
-
Visual Studio プロパティペー...
-
ローマ字からカナに変換する方...
-
CSVファイルの中で、「 , 」カ...
-
エクセルにMicrosoft Barcode C...
-
エクセルで数値を全角文字(カ...
-
EXCELからCSVにすると余計なカ...
-
IEからEdgeへの移行に伴うIMEの...
-
マクロを使ってフォルダー内に...
-
英数字のみ全角から半角に変換
-
エクセルでの”々”の扱い
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Excel VBAでPDFファイルをMicro...
-
CString から LPCTSTRの型に変換
-
文字コードの%E3%80%とは何です...
-
SJIS->UTF8->SJISコード変換に...
-
VB6にも「ToString」ってあり...
-
VBScript文字列をSJISからUTF8...
-
URLが日本語なのになぜ表示...
-
Visual Studio プロパティペー...
-
算用数字(半角)から漢数字へ...
-
エクセルでの漢字(全角ひらが...
-
文字化けしてしまって困っています
-
ローマ字からカナに変換する方...
-
ひらがなから全角カタカナへの...
-
改行を含んだ文字列を正規表現...
-
五十音の並べ替えsortを教えて...
-
CString型からdouble型への変換
-
gccでiconvを使った文字コード...
-
シャープ(#)の受け渡し
-
テキストをhtml変換するには
-
【PHP】全角記号を半角記号...
おすすめ情報