
Perl5.8で、EUCで保存されたテキストファイルを読み込み、Shift-JISで保存しようとしてます。
EUCからShift-JISへの変換は、Encode.pmを使用しています。
テキストファイルに「髙」(ハシゴ高 0xFCE2)や「﨑」が入っていた場合、変換されたデータは「?」(0x3F)になってしまいます。
「髙」や「﨑」をPerlを使用してEUCからShift-JISする方法はありませんでしょうか?
======================================
use Encode qw/ from_to /;
open IN, "data.txt";
$data = <IN>;
close IN;
from_to( $data, 'euc-jp','shiftjis');
open OUT, ">data2.txt";
print OUT $data;
close OUT;
======================================
宜しくお願いします。
No.2ベストアンサー
- 回答日時:
>Shift-JISの「髙」(0xFBFC ?)に変換したいのですが、どのようにすればよいのでしょうか。
”髙”という文字は、シフトJIS上、\xEEE0と\xFBFCにマッピングされています。
EUC-jpの\xFCE2に相当するのは、領域的には\xEEE0が妥当かと思われます。
ちなみに、nkfで、コード変換すると、\xFCE2 => \xEEE0 で変換されます。
perl標準のencode.pmでがんばるなら、Encode::FB_XMLCREFを使った上で
気に入らない部分を後から、自前コーディングで、気に入るように加工するしか
ないかと思います。
ありがとうございます。
お礼が遅くなってすみません。
jcode.plでも、\xFCE2 => \xEEE0 で変換されました。
特にEncode.pmを使う理由も無いので、jcode.plを使うことにします。
No.1
- 回答日時:
下記のサイトが参考になるかと思います。
http://www.kawa.net/works/jcode/uni-escape.html
ちなみに「髙 Perl」のキーワードでYahoo検索してHITした最初のサイトです。
検索を有効利用すればすぐに分かることもあるのでちょっと試してみては如何でしょうか。
参考URL:http://www.kawa.net/works/jcode/uni-escape.html
この回答への補足
ありがとうございます。
教えていただいたサイトは、すでに見ていますが、それでも分からなかったので、ここに質問しました。
すみません、そのことを書いてなかったですね。ごめんなさい。
教えていただいたサイトのようにすると、以下のような結果になります。
from_to( $data, 'euc-jp','shiftjis', Encode::FB_XMLCREF );
【結果】(テキストファイル)
郄
Shift-JISの「髙」(0xFBFC ?)に変換したいのですが、どのようにすればよいのでしょうか。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Excel(エクセル) エクセルのVBAについて とあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
- CGI htmlからパラメータで、cgiに渡したい。 1 2023/02/06 16:15
- PHP PostgreSQLからCSV形式でエクスポートする際にカラム内の改行をとる方法 1 2023/02/22 10:05
- 英語 From the data mentioned that extracted from the cu 1 2023/01/25 19:55
- その他(プログラミング・Web制作) sedの動作 2 2022/10/10 13:38
- C言語・C++・C# [至急]Project Euler:#17Number letter countsコード入力出力解説 2 2022/09/24 02:46
- その他(SNS・コミュニケーションサービス) 自分のpcがハッキングされたようなメールが来たのですがどうすればいいですか? 4 2022/10/02 16:14
- その他(プログラミング・Web制作) pythonでDBのカラム名で取得したオブジェクトの値を表示したい 1 2022/05/13 03:41
- Windows 10 EFS(内容を暗号化してデータをセキュリティで保護する)はHomeエディションでは使えませんか??? 1 2023/05/20 18:16
- その他(プログラミング・Web制作) Python - Excel で Webからデータを連続取得したいのですが エラーが出ます 1 2023/07/06 20:08
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
Excel VBAでPDFファイルをMicro...
-
CString から LPCTSTRの型に変換
-
シングルクォーテーションの変換
-
文字コードの%E3%80%とは何です...
-
SQLのデータで半角カナを全角に...
-
エンコードとコンバートの違い...
-
python/変数の変換
-
漢字からカタカナ変換マクロ
-
URLが日本語なのになぜ表示...
-
JISとシフトJIS
-
CSVファイルの中で、「 , 」カ...
-
IEからEdgeへの移行に伴うIMEの...
-
エクセルで数値を全角文字(カ...
-
CSVの定義
-
Excelについて質問です。 セル...
-
COBOL・全角判定
-
VBA 文字に半角が含まれて...
-
住宅にカナを入力する際に丁目...
-
英数字のみ全角から半角に変換
-
VBA 置換文字がみつからない時
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Excel VBAでPDFファイルをMicro...
-
CString から LPCTSTRの型に変換
-
文字コードの%E3%80%とは何です...
-
CString型からdouble型への変換
-
SQLのデータで半角カナを全角に...
-
ローマ字からカナに変換する方...
-
Delphiの型変換
-
VBScript 全角英数記号→半角英...
-
SJIS->UTF8->SJISコード変換に...
-
テキストをhtml変換するには
-
漢数字の変換
-
Encode.pmで「髙」(ハシゴ高)...
-
VBScript文字列をSJISからUTF8...
-
vbwide(半角⇒全角変換)について
-
文字列を quoted-printable 文...
-
エクセルでの漢字(全角ひらが...
-
oracle10g eucのblobをsjisのch...
-
漢字からカタカナ変換マクロ
-
VB6にも「ToString」ってあり...
-
goo blogでyou tube を埋め込む...
おすすめ情報