No.1ベストアンサー
- 回答日時:
興味があったので調べてみましたが、見れば見るほど「なにこの変態」ってなっちゃいました…
JEFコードにしても漢字部分はJISコード+8080で変換できるので、文字のコード表内部での前後関係はJISと変わらないはずです。JISだと青=4044で、旭=3030。しかし今回のは、そのまま読むと青=A53Cで旭=A6F6だから前後関係が逆転しています。ちなみにこの前後関係はEUCでもUnicodeでも、旭の方が青より先に登場しますから、それが逆ってのはどんだけ変態なんだよって話です。通常使われているどのコードにも当てはまらないことになるので。
エンディアンやデータの格納順序の問題でもなさそうだし、これは困りましたね。後は数をまとめて色んなパターンを解析するしかなさそうです。もうちょっとヒントがないと厳しいです。
No.2
- 回答日時:
> もしかして解析のポイントになるかと
もっとわからなくなりました…
それで実働しているシステムがあるなら、JISコード表の文字を順番に16文字ずつ流し込んで、どう変換されるかを調べていくという地味な作業で解読できますが。
No.3
- 回答日時:
面白そうなので考えてみましたが分かりませんね。
1バイト目にAx・2x・3xというのはEBCDIC互換っぽいです。少なくとも2x・3xがある時点でASCII互換ではありえません。
ただしEBCDICだとすると「雲」の「D5」だけEBCDICとかぶるはずなので不可解です。
fakeflakeさんの言う通り、JIS・Unicodeの順と合いません。
ついでに「岡」「沖」はJISで隣り合っているのに対しこのコードでは隣り合っていません。
JISでもUnicodeでもない文字集合というと思いつくのが中国語のGBコードくらいですが国内のメインフレームで使われるのは考えづらいです。
コード順に並べてみましたが特に順番に意味を見いだせません。
稚隠釧函縄 紋 大美島田川岡佐福内出森広青鹿賀秋児別路岐旭沖館奄 雲
他に思いつくのは漢字をASCIIに変換したものを更にEBCDICに対応させて読むとかの変態コードくらいです。
あと気になるところとしては1バイト文字やカナ・数字はどのようなコードになっているのかと、JIS第2水準以上の文字は存在するのかですね。
No.4
- 回答日時:
これはますます分からなくなりました。
(全角の?)「B」「C」「(」「)」のコードは上位がA1、下位がASCIIコードと同一です。
ここまでASCIIと無関係なEBCDICだと思ってきたのに。
JISコード(ISO-2022-JP)も英数字は下位バイトがASCIIと同じ値ですが括弧は異なるので、やはりJISの順ではなさそうです。
また、ASCII順の部分があることで、「漢字コードをASCIIとして読んだ文字と同じ文字のEBCDICのコード」のような変態変換はやっていないのだろうと考えられます。
そして「グループ」=「A242 A2D7 A2B0 A250」という、濁音半濁音と清音の間に長音符号がある謎の順序の方は、輪をかけて分かりません。
「ー」=「B0」はJIS X 0201(半角カナ)と同一ですが「ル」=「D7」は惜しいところで異なります(半角カナのD7は「ラ」)。
2文字少なくなる理由も思いつかないので(と書こうとしたらひらがなとカタカナの「へ」「り」を同一視するというのを思いついてしまったが、ファミコン時代じゃあるまいし)、まあ偶然ですかね。
「グ」と「プ」の間も普通に濁音半濁音が順に並んでいるとするとスペースが足りませんので、単純な並び順ではなさそうです。
R90やU90というものは軽くググった限りではShift_JISやEUCに外字を加えたもののように見えます。
あと雑多な感想的なものを書きますと、
1バイト目がA1がASCII、A2がカタカナということで、きっとA3はひらがななんだろうなあ。
そうすると次でA4の漢字が始まるということは全角記号類はどこだろう。A0?
A0やA1から始まるというのはJISコード(ISO-2022)・EUCっぽい。
漢字がAxがほとんどで他が2x,3xというのは、なんでBxあたりを使わないのだろう。そのへんに既に文字があった? そんな文字コードあったかなあ。
富士通のEBCDICを見るとAx列にカタカナが入っているっぽい。
http://software.fujitsu.com/jp/manual/manualfile …
このカタカナ部分を2バイト文字に? いや8xや9xが使われていないのが不自然だ。
それにしても奇妙な並び方のカタカナだ。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- PHP phpの imap_search で漢字コード 1 2022/09/06 17:32
- JavaScript フォームが空欄の時にフォームの外をクリックすると、エラーが出るコードを調べています。 1 2023/06/25 11:51
- その他(プログラミング・Web制作) 文字コード及びフォントに関する次の記述を読み,適切なものをすべて選べ。 ASCIIとは,英数字だけを 4 2023/01/11 19:10
- Excel(エクセル) Excelの操作方法を教えてください!頭文字2~8文字で特定の値に返す方法 8 2022/07/14 11:26
- その他(パソコン・スマホ・電化製品) 2つの白丸「〇」の使い分けについて 2 2022/06/07 09:19
- 作詞・作曲 作曲家を目指して音楽理論の勉強をしていますが、あと何をすれば良いのかわからなくなりました。 楽典・実 6 2023/04/27 19:12
- HTML・CSS VS.NETのコードを色合いも含めてHtmlに貼り付けたい。 1 2023/02/02 14:15
- C言語・C++・C# S-JIS → JIS コード変換するには 3 2023/02/09 23:55
- Visual Basic(VBA) 該当セルの値を別ブックのシート名と一緒であればコピーしてほしい 1 2022/11/10 20:12
- Visual Basic(VBA) ExcelのVBAコードについて教えてください。 2 2022/06/22 11:19
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
pythonにてseleniumを使うも、...
-
Exel VBA 別ブックから該当デ...
-
chatgptでつくってもらったコー...
-
ExcelのVBAコードについて教え...
-
パイソンプログラム
-
フィルターかけた後、重複を除...
-
1、Rstudioで回帰直線を求める...
-
vb6.0の実行時エラー'3075'につ...
-
Gitのクローンについて
-
特定行の背景色を変えたいのですが
-
Excel VBA素人です。VBAで図形...
-
コンパイルエラー 変数が定義...
-
access2003 クエリSQL文に...
-
楽観的排他処理のためViewState...
-
プレースホルダー
-
CFormViewでの印刷について
-
変数名「cur」について
-
文字コードについて
-
Excel VBAについて
-
SQL
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
フィルターかけた後、重複を除...
-
access2003 クエリSQL文に...
-
1日に1人がこなせるプログラム...
-
Exel VBA 別ブックから該当デ...
-
pythonにてseleniumを使うも、...
-
ExcelのVBAコードについて教え...
-
ExcelのVBAコードについて教え...
-
chatgptでつくってもらったコー...
-
欠番の抽出について
-
JANコードとPOSコードは同じ?
-
JavaScriptの定数名が取り消し...
-
1、Rstudioで回帰直線を求める...
-
特定行の背景色を変えたいのですが
-
変数名「cur」について
-
PreviewKeyDownイベントが2回...
-
将来AIが進歩してくるにつれて...
-
ACCESSユニオンクエリでORDER B...
-
COBOLの文法
-
VBAでファイルオープン後にコー...
-
Nullの使い方が不正です。
おすすめ情報
fakeflakeさん
ご回答ありがとうございました。
コード体系に詳しくないものでアドバイスありがとうございます。
もっとデータが欲しいというご要望ですね。
まだ少ないですが、以下を参考にしていただけませんか。
奄美大島 AA32 A427 A424
秋田 A5B0 A4B3
福島 A4C5 A43F
福岡 A4C5 A4BC
広島 A4DF A43F
函館 2EDE A7B2
佐賀 A4C0 A5A0
鹿児島 A570 A5D0 A43F
よろしくお願いします。
奄美大島のコードで、島の A43F が漏れていました。すみませんでした。
殆どの漢字コードは Axxx ですが、函 だけは 2EDE と違っていますね。
もしかして解析のポイントになるかと思いましたので、A で始まらない漢字を以下にピックアップします。
出雲 A4CC D5E4
釧路 2E30 A664
紋別 3C39 A5F1
沖縄 A6FD 2FA4
隠岐 2BD6 A6D5
稚内 28ED A4C8
以上よろしくお願いします。
fakeflakeさん
もっと分からなくなりましたか。
何でしょうね。
システムは実働しているのですが、お客様のシステムですのでテストはできないです。
現行システムのソースの調査をやっていたところ、このコードにぶつかってしまいました。
見ているファイルのタイムスタンプは2002年ですので、かなり古いですね。
あと、ファイル名に .ebs の拡張子があるので、EBCDICコードが絡むのかも。
さてさて。
各位へ
富士通独自のSJISコード体系の R90 とか R90 と親和性が高いと言う U90 とか怪しくないですかね?
コード表が検索できず確認できませんでしたが。
アルファベットとカタカナの漢字コードが分かりました。これから分からないでしょうか?
BCグループ A142 A143 A242 A2D7 A2B0 A250
(株) A128 A7AE A129
よろしくお願いします。
皆さんへ
質問者です。
原因が分かりました。
日本語文字セットコードページ300系のIBMのマシンで作成した漢字入りのファイルを単にEBCDICからJISにコード変換したファイルのようです。
例えば、青森と言う漢字はコードページ300では、464C 459D となります。
これを1バイトづつ単純にEBCDICからJISにコード変換すると、45AC A4CE となります。
こういうへんてこなデータをマスターファイルとして使っているシステムでした。
EBCDIC変換したファイルのコード体系が分かって、カラクリが分かりました。
皆さんがコード体系の話しをされたので分かりました。ありがとうございました。
ベストアンサーは最初に回答をくださった Fakeflakeさんにさせていただきます。