最初のアセンブラ

Question

人間がハンドアセンブル際にアセンブリ言語と機械語の対応表を見比べて翻訳する作業を、コンピュータの黎明期に機械語で最初に作られたアセンブラはどのように行っていたのかということを教えて下さい。

プログラミング言語の歴史を考えてみると、（フォン・ノイマン型）コンピュータの黎明期では全てのプログラムは最初人間が直接真空管やディップスイッチのオン/オフを切り替えることで、機械語でプログラムを入力していたと思います。その後アセンブラが開発されたことで、人間はパンチカードやカセットテープなどを通してアセンブリ言語でプログラミングを行えるようになったと聞きました。

アセンブリ言語は機械語と１対１で結びついたもので、アセンブラはアセンブリ言語を機械語に翻訳するのだと言うことは分かります。しかし、パンチカードやカセットテープで入力したアセンブリ言語も、コンピュータにとっては根本的には0/1(スイッチのオン/オフ)という点では変わりはなく、最初のアセンブラはその0/1をどのようにして正しい機械語の0/1に変換することが出来たのでしょうか？

少し質問の意味が分かりにくいかもしれませんが、例えば

MOV B, A  //Bレジスタの内容をAレジスタに送る

といったアセンブリ言語は、機械語では

01000000

に相当するかもしれません。しかしコンピュータがパンチカードを読み込んだ時点では

01010100

といった信号として入力されるとしたら、機械語で最初にアセンブラを作成した人はどのようにしてそれを適切な機械語(ここでは01000000）に翻訳出来たのでしょうか？

想像では最初に機械語で非常に超簡単なアセンブラの原型とも言えるプログラムを作って、それを元にした簡単なアセンブリ言語（の原型）でより高度なアセンブラを作る、といったことを繰り返していまのアセンブラが開発されていったと思いますが、では最初のアセンブラの原型とはメモリ上ではどのように実現されていたのか、ということが気になったので質問させていただきました。アセンブリ言語で実際にプログラムのイメージはこんな感じでは？ということを書いて下さっても構いません。

よろしくお願い致します。

ymmasayan · Accepted Answer

No.5です。補足質問にお答えします。
色々資料をあさっていたので遅くなってしまいました。

>　２進コードへの変換はテーブルを探す方法と変換表で一発で探す方法というのがあまりよく理解出来ないのですが
普通はテーブルサーチ(逐次検索、２進検索)というのを使います。
しかしスピードが遅いのでハードレベルやＯＳレベルでは一発検索(変換表)もよく使われます。
例えば確か「文字Ａ」はＥＢＣＤＩＣでは(Ｃ１)16＝１９３、ＡＳＣＩＩでは(４１)16＝６５だったと思います。
つまり表の６５＋１番目に１９３を入れた表と表の１９３＋１番目に６５を入れた２つの表があれば
検索無しに「Ａ」の一発コード変換が出来るのです。

>　私が一番知りたい答えは、具体的にその１２０バイトに何（どういった命令）が書かれていたか？ということです。
はい、私もそれが知りたいです。
しかし、色々調べたり推測したりしましたが結論には至りません。
当時はメーカーとしてもトップシークレットだったと思いますから。

２進コード→文字コード→ニモニック変換→機械語
テーブルサーチや変換表がありますが、一長一短があります。
変換速度とテーブルの大きさです。
最近の検索技術では２分木というのも使われますが当時どのようになっていたかは判りません。

>　初期のＩＢＭだとSystem/360だと思いますから命令語長が２、４、６バイトの何れかです。
実はＩＢＭ１８００というプロコン(現在の分類ではミニコン)１６ビット機でした。
科学技術計算用の１１３０の兄弟機でした。
世界中に１０００台くらい売れていたのでベストセラーですね。
余談ですが日立のプロコン１号機ＨＩＴＡＣ７２５０は１８００のデッドコピーでした。

命令語は２バイト、４バイトのみです。

>　１２０バイトに入れられる機械語命令は約４０～６０命令ぐらいですよね。
>　アセンブラでプログラムした事のある人は分かると思いますが、さすがにその命令数で簡易なアセンブラも組めません。
>　ニーモニックの文字列比較する文字を入れる事さえ無理なバイト数です。
実は私も同じ意見です。
ここ数日？考えていたのですがある考えにいたりました。
ＤＣ命令やＥＱＵ命令などの擬似命令を読み込んで解析し、メモリーに展開できれば
比較的簡単に機械語命令を作り上げることが出来るのではないかと。
今の計算機と違ってそのころはデーター部を実行したり(例えばパッチ)、命令語を実行時に書き換えるなどは
可能かつ日常茶飯事でしたから。

私の推測の結論は１２０バイトの機械語で擬似命令を解析し機械語で本物のアセンブラーをメモリー上に展開し、
これにコントロールを渡すことで本物のアセンブラーを起動させたのではなかろうかということです。

吊橋を掛けるときにヘリでロープ(または細いワイヤー)を張ってそのあと順々に太いロープを牽引していきますが
これに似ていますね。

あくまでも質問者さんの好奇心に応えて４０年ほど前の淡い記憶で書いているだけなので本当は的外れかも知れません。

zwi · Answer

一番古いのでS/360系の互換機(FACOM230/25だったかな？)とかしか触ったことがないので、「IBM 1800」は未知のマシンですね。

wikiにありましたが、これででしょうか？
http://ja.wikipedia.org/wiki/IBM_1800
1180の原型の1130のエミュレータもあるみたいですね。
http://ibm1130.org/

>私の推測の結論は１２０バイトの機械語で擬似命令を解析し機械語で本物のアセンブラーをメモリー上に展開し、これにコントロールを渡すことで本物のアセンブラーを起動させたのではなかろうかということです。

これは、また別のカードからアセンブラーを読んだって事ですか？それとも意味が違います？
紙テープから大量にコードを読んだのなら納得なんですけど。私の経験では実際に紙テープに機械語を書き出したり紙テープから読み込んだりしたし。

zwi · Answer

>C言語などで実装するならまだしも、アセンブリ言語でこれを実装するとなると相当命令数が長くなりそうな気がします・・（アセンブリの経験はほぼないのではっきりとは分かりませんが・・）

アルゴリズムは合っていると思います。
まぁ、それでも簡易なアセンブラなら１ＫＢとかで組めると思いますよ。実際にやってみないと分かりませんが。
Ｈ８マイコン等で実際に簡易アセンブラを作ってみるのが一番理解できるかもしれませんね。

zwi · Answer

>最初のアセンブラーは１２０バイトの機械語でプログラムされていたということは分かりました。

議論する気はないんですが、初期のＩＢＭだとSystem/360だと思いますから命令語長が２、４、６バイトの何れかです。
http://journal.mycom.co.jp/column/architecture/056/index.html
平均１命令４バイトよりちょい少ないと仮定して１２０バイトに入れられる機械語命令は約４０～６０命令ぐらいですよね。アセンブラでプログラムした事のある人は分かると思いますが、さすがにその命令数で簡易なアセンブラも組めません。ニーモニックの文字列比較する文字を入れる事さえ無理なバイト数です。う～ん。なぜカード一枚でアセンブラが起動できるかわかりません。

で、簡易アセンブラのコードですが概念だけ。

[命令テーブル]
OPコード(１バイト)
文字列長(１バイト)
文字コード
：
文字コード
を命令数分。

[ニーモニックコード]
(1)MOV (2)A,B

(1)入力されたニーモニックの文字コードと命令テーブルの文字コードが一致するものを探し、一致した命令テーブルの命令(OP)コードを得る。
(先頭文字から空白までの文字で一致するものを命令テーブルから検索)
(2)オペランドを解析して、どのレジスタを対象としているかオペランドコードに変換する。これもswitch～case的な処理を行う必要があります。

ymmasayan · Answer

No.5です。
ご指摘がありましたので補足します。
ここでは議論が禁じられていますのでできるだけ議論にならないように書きたいと思います。

>　「これは８０×１２穴＝９６０ビット＝１２０バイトの機械語です。
>　恐らくこれが最小限のアセンブラーだったと推測されます。」
>　機械語＝アセンブラーみたいに成ってますが、これはどちらなんでしょうか？
機械語で書かれた(あるいはアセンブルされた)アセンブラー(プログラム)という意味です。
つまり翻訳ツールです。

>　私から見たらニモニック→マシン語変換されないんで、ただのローダーだと思うんですが。
１枚だけバイナリーのカード(コールドスタート)を読んでそのあとにはまさしくアセンブリー言語で書かれたカードを積んでいました。
このことから９６０ビットのカードはアセンブラーとしか考えられないのです。

もう少し詳しく言うとこれはあくまでもシステム生成時の話です。
ＨＤＤに何もない状態ですので
１．まずコールドスタートのあとアセンブリー言語で書かれた仮ＯＳにＥＱＵで沢山のパラメータを与えてアセンブルします。
２．結果としてパンチカードに２進出力された本物のＯＳが出来てきます。
３．そのＯＳをＨＤＤに読み込み本番準備が完了です。
４．通常のスタートはＨＤＤからローダーを使って行います。

以上のようにコールドスタートカードと仮ＯＳの間にアセンブラーらしきものが存在しなかったのです。
アセンブラーがファームウェアーで入っていたなどは考えられません。
何しろメインメモリーが１２８ＫＢＭＡＸの磁気コアでしたから。

>　「(1)２進数で読み込んだカードを文字コードに変換する。」の事ですが、初期はCPUで変換してたんでしょうか？
これも確かなことはいえませんがカードリーダーが２進カードと文字カードを差別無く読んでいたことから考えて
ＣＰＵで変換していたと考えるのが自然だと思います。
コンソールのキーボードも一文字づつ割り込みを掛けて読んでいましたから。
キーボードにＣＰＵが内蔵されて文字列転送されるようになったのはかなりあとの話です。

zwi · Answer

すいません、ymmasayanさん質問者のmiyaken912さんを混乱させたくないので疑問というか質問です。

２．の「これは８０×１２穴＝９６０ビット＝１２０バイトの機械語です。恐らくこれが最小限のアセンブラーだったと推測されます。」
なんですが、機械語＝アセンブラーみたいに成ってますが、これはどちらなんでしょうか？私から見たらニモニック→マシン語変換されないんで、ただのローダーだと思うんですが。文字通りＩＰ(Initial　Program)なのではないでしょうか。

３．の「(1)２進数で読み込んだカードを文字コードに変換する。」の事ですが、後期のパンチカードリーダかつＯＳ下でしか使ったことがないのでが、カードリーダＩＯチャネルから読み込んだ時点でEBCDIC文字コードになっていた気がするんですが、初期はCPUで変換してたんでしょうか？
かれこれ私がかかわったのは２０年以上前ですが。

ymmasayan · Answer

１９６０年頃からコンピューターを触ってきました。
全ての機種を知らないのでかなり推測もありますが。

まず、最初に基本的なところから。
１．コンピュータを語るには、コンピューターの本能と知能を分けて考える必要が有ります。
　本能・・電源を入れただけで出来ること。人間の赤ちゃんが生まれた状態に相当します。
　知能・・あとから教えることで出来るようになることです。

　実はこの本能と知能の分担が時代により、またメーカーにより、機種により大きく違うのです。

余談ですがＰＣ初期のＮＥＣ－ＰＣ８００１などは３２ＫＢ位のＲＯＭが搭載してあって
電源を入れるとＢＡＳＩＣ(インタープリター)でいきなり作業が出来ました。

初期のコンピュータは本能がほとんど無く、スイッチとランプで入出力してました。
もちろん機械語オンリーです。
しかし機械語は人間に難解なのでニモニック(記号化)という考えが生まれました。
　　ニモニック
　　http://www.atmarkit.co.jp/icd/root/92/189003792.html

しばらくはこのニモニックを使ってプログラミングしハンドアセンブルで機械語入力していました。

その後ハンドアセンブルを自動化するようにしたのがアセンブラーです。

２．本能と知能について初期のＩＢＭマシンの例をあげてみましょう。
　本能といえばＩＰＬ(Initial　Program　Loader)でＩＢＭ８０欄カードを１枚だけ読み込む機能でした。
　これは８０×１２穴＝９６０ビット＝１２０バイトの機械語です。
　恐らくこれが最小限のアセンブラーだったと推測されます。
　あとはパンチカード１枚を(８０文字)として読み込んで知識をどんどん膨らまして行ったのでしょう。

３．アセンブラーの基本構造は
　　(1)２進数で読み込んだカードを文字コードに変換する。
　　(2)文字列を分析し対応する２進コードに変換する。
　　でいいはずです。
　　２進コードへの変換はテーブルを探す方法と変換表で一発で探す方法があります。
　　例えばＡ＝ＡＳＣ(３１)＝４９→表の４９番目が’Ａ’

４．簡単なアセンブラーを使ってもっと複雑なアセンブラー例えばマクロアセンブラーを作れることは質問者さんの言われるとおりです。

５．現在では「コンパイラーコンパイラー」という本がたくさん出ています。
　お察しの通り、新しいコンパイラーを作るための基本的なコンパイラーのことです。

余談ですがＣ言語というのもＵＮＩＸという巨大ＯＳを書くために作られたものです。
Ｃ言語はプロが使うもので素人が使うと大怪我をするといわれるのもこのあたりから来ています。

zwi · Answer

大体考えは合ってます。

>一致した場合はその命令の機械語をプログラム領域として確保してあるメモリアドレスに書き込む。この場合は対応表から01010100がMOV B,Aと一致するので01000000を翻訳した機械語プログラムとしてあるメモリアドレスに書き込む

まぁ、最初のころのコンピュータはメモリが少ないので直接パンチテープあたりに機械語コードを直接書き出していた可能性が高いです。

>妙な質問かもしれませんが、情報工学を独学で勉強しており、また初心者ゆえC言語やPHPなどのプログラム自体は書けますがそもそも非常に根本的なところでプログラムやコンピュータというのがどう発展してきたのかというところに興味があります。どうぞよろしくお願い致します。

歴史というか、ＣＰＵの基礎的なことを勉強したほうがコンピュータの理解には良いかもしれません。

アセンブリ言語スタートブック
http://www.amazon.co.jp/gp/product/4774138428/
CPUの創りかた(表示はアレですが中身はまじめです)
http://oshiete1.goo.ne.jp/kotaeru_reply.php3?q=5028460
コンピュータアーキテクチャの話
http://journal.mycom.co.jp/column/architecture/index.html
基礎から学ぶコンピュータ
http://rryu.sakura.ne.jp/compfund/index.html

ralf124c · Answer

最初のコンピュータを触ったというほど古い人間ではないのですが、某大手電機メーカーグループ会社で勤務していた際は工場内に過去機種のセンターが有り、担当機種の保守を行っていました。
中には骨董品と思われるメインフレーム(大型計算機)があり、プログラムの基本入力はトグルスイッチやロータリースイッチ(MOVやLDやADDなど基本命令を指すもの)とプッシュボタンを利用していました。
アセンブラは各機種のドキュメントにニモニックコード表が付いていて、アセンブラのソースで書いたものを対応表から16進数の機械語コードに直し(ハンドアセンブル)、さらに2進数から8個のトグルスイッチで01をセットしてプッシュボタンで少ないメモリ領域にデータ入力を行っていました。
ただし立ち上げの際は、OSを含む全プログラムをそうやって入れているとたいへんなので、通常はIPLプログラムを特定にアドレス(アドレス入力もトグルスイッチ)に対して先の方法で手入力して、紙テープなど外部装置から一気に流し込むというやり方で起動を行っていました。
慣れると16進ダンプコードの処理内容がなんとなくわかるようになりますが、ハンドアセンブルの際は表が手放せませんでした。
ハード設計者のひとりに話を聞いた際には、開発時にはコードをある程度憶えていて(自分で命令を決めて作ったのですから)結構スラスラと書いていたそうです。

don_go · Answer

＞機械語で最初にアセンブラを作成した人はどのようにして
＞それを適切な機械語(ここでは01000000）に翻訳出来たので
＞しょうか？
全て手作業で行います。
機械語に対応するコードを全て暗記又はコードの対応表を参照
して機械語のプログラムを作っていきます。
＃ジャンプ先等のアドレスも全て手計算

最初のアセンブラ

No.5です。

一番古いのでS/360系の互換機(FACOM230/25だったかな？)とかしか触ったことがないので、「IBM 1800」は未知のマシンですね。

>C言語などで実装するならまだしも、アセンブリ言語でこれを実装するとなると相当命令数が長くなりそうな気がします・・（アセンブリの経験はほぼないのではっきりとは分かりませんが・・）

>最初のアセンブラーは１２０バイトの機械語でプログラムされていたということは分かりました。

No.5です。

すいません、ymmasayanさん質問者のmiyaken912さんを混乱させたくないので疑問というか質問です。

１９６０年頃からコンピューターを触ってきました。

大体考えは合ってます。

最初のコンピュータを触ったというほど古い人間ではないのですが、某大手電機メーカーグループ会社で勤務していた際は工場内に過去機種のセンターが有り、担当機種の保守を行っていました。

＞機械語で最初にアセンブラを作成した人はどのようにして

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング