プロが教えるわが家の防犯対策術!

こんにちは。

メインフレームのデータをUNIX上で加工しています。
かな文字が化けるのでどうしたらよいかアドバイスをお願いしたいのですが。

そもそもホスト上のデータをUNIX系で使用するには、EBCIDICというホスト系のコード体系をASCIIコードに変換しないといけません。
それは、ホストのFTP機能で変換されるようですが、
どうしてもカナ文字は化けてしまいます。
どなたか経験ある方、このような場合どう解決したか教えてください。

A 回答 (2件)

経験はありませんが、知識から。



EBCDIC では、英小文字とカナ文字が同じコード領域に割りあたっており、どちらかを
選択することになります。

コードをホストの ftp で変換しているとのことですが、仕様がはっきりしない
(「変換される *よう* 」とある)のであれば、無変換で unix へ取り込んで、
dd コマンドでコードの変換をした方が良いのかも。

漢字コードも混じっているようであれば、iconv を使うことも検討してください。
    • good
    • 0
この回答へのお礼

ありがとうございます。

binaryでFTPしてddコマンドで変換してみました。(漢字コードははいっていません)
しかし結果は同じでした。

根本的にEBCIDICのコード体系、ASCIIのコード体系がどうなっているのか
よく分かっていないので、そのへんの基本的なことから理解してからでないとだめですね。

>EBCDIC では、英小文字とカナ文字が同じコード領域に割りあたっており、どちらかを
>選択することになります。

の記述もよく理解できてません。すいません。

お礼日時:2002/07/30 16:46

的外れかもしれません。


FTPでコード変換されるとありましたが、FTPでは、BinaryモードかTextモードでコード変換はされないように記憶しています。いにしえの記憶なので明確ではないのですがVMやMVS/TSOのOS上のCICSのでは、文字コードは、IBM漢字として取り扱われているのではないかと思います。DBCS(Double Byte Character Set)では、SO/SI(Shift Out/Shift In)で、コード(SO X'0E':SI X'1E)挟まれて漢字を処理していたはずです。そのために、半角かな文字(?)が化けているのではと思いました。
PCのファイル転送で[(JISCIIオプションで転送して、TELNETや、FTPでUNIXに転送してみてはいかがですか。SBCS(Single Byte Character Set)セッションでは、ASCIIコードのはずで。ホストのCPGID(Code Page Global Identifier)、GCSGID(Graphic Character Set Global Identifier)に290/332または、300/370ではないかと思います。

もう10年以上も前の記憶です極めてあいまいです。ごめんなさい。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!