プロが教える店舗&オフィスのセキュリティ対策術

下記のページの本文のテキストは

http://www.hs-augsburg.de/~harsch/graeca/Chronol …

特殊な文字であり、これらの特殊文字のソースはすべて「&#○○;」というunicodeになっています。
例えば本文の1行目は
Πίνδαρον ὑψαγόρην Καδμηίδος οὔδεϊ Θήβης
というテキストになっており、これには
<h3><span class="f_textusi">&#928;</span>&#943;&#957;&#948;&#945;&#961;&#959;&#957; &#8017;&#968;&#945;&#947;&#972;&#961;&#951;&#957; &#922;&#945;&#948;&#956;&#951;&#943;&#948;&#959;&#962; &#959;&#8020;&#948;&#949;&#970; &#920;&#8053;&#946;&#951;&#962; </h3>
というソースが記述されています。
(言い換えれば、ソースは「Πίνδαρον ὑψαγόρην Καδμηίδος οὔδεϊ Θήβης 」とはなっていません。漢字平仮名テキストのソースとはワケが違う。)

このサイトの他のページも含めるとこれらの特殊文字は何千万か何億かという量に達していますが、1つ1つの「&#○○;」をすべて手作業で入力したのでしょうか?

こういったソースを生成させるプログラムかソフトなどがあるのでしょうか?

なお、
こ の 質 問 文 に 対 す る 回答になっている文章以外は、何があっても 絶 対 に 書きこまないでください。

A 回答 (2件)

申し訳ありませんが、ギリシャ文字を入力する具体的なソフトは存じません。


ただ、日本語を入力するための、かな漢字変換のソフトなども、日本語の入力に特化したものなので、同じようなものがあるとは思います。

ここでは、Windows 環境を想定して、とりあえず、入力と出力が可能な方法の一例を示します。

・入力
 まず、ギリシャ文字をユニコードで編集可能なソフトが必要です。
 これに文字入力を行います。 

 もしも、ワード(あの、ワープロソフトです)で、最近のワードは対応しているようですから、
これが使えます。
 なければ、また、EmEditor ( http://jp.emeditor.com/ ) のうに、ユニコードに対応したエディタが使用可能と思います。

 文字入力の方法ですが、
http://homepage1.nifty.com/suzuri/000/pc6.html
に情報がありました。

 このページにある方法が使えるのではないかと思います。
 
 特に、最後にある、IMEパッドから入力する という方法は、(マウスで一文字ずつ、文字をクリックする必要がありますが)文字を見ながら、入力可能です。


・出力
 ここで編集したものを、数値文字参照形式に直す必要があります。
 探してみると、
HTMLCode
http://www.vector.co.jp/soft/winnt/net/se483022. …

 が使えそうです。
 ワードに入力した後、HTML Code の上側のウインドウにこれをコピーした後、「10進変換」をクリックすると、数値文字参照形式に変換されたデータが得られます。

これで、編集はワード上で文字を見ながらできますから、少しは楽になるかと思います。
    • good
    • 0
この回答へのお礼

有用な回答をいただきました。ありがとうございました。

お礼日時:2014/02/10 13:55

それは、ユニコードがというよりも、その表現形式のひとつで、数値文字参照形式といいます。


たとえば、「漢字平仮名テキストのソースとはワケが違う。」は、
&#28450;&#23383;&#24179;&#20206;&#21517;&#12486;&#12461;&#12473;&#12488;
&#12398;&#12477;&#12540;&#12473;&#12392;&#12399;&#12527;&#12465;&#12364;
&#36949;&#12358;
と表されます。
(&#は全角にしました)


普通に文字を入力した後、保存するときにこういう形に変換して保存する機能を持ったソフトや、単に、変換するソフトもあります。
ユニコードで入力すれば(その言語を入力するための、言語パックの類いや、対応するソフトはあるいは必要ですが)、それを出力するときに、ユニコードとしての文字コード(つまりは数字の塊)を、こういう形で表現する仕掛けになっているわけです。
    • good
    • 0
この回答へのお礼

回答をいただきありがとうございました。

具体的には、たとえば質問文に示したサイトなら、このサイトの古典ギリシャ文字はすべて元はこの文字で入力して、これを保存するときにソースがこういった数字の塊に自動的に変換されたということですか。

自分は自分のサイトではソースを手書きで作って古典ギリシャ文字等はこれらの数字の塊をそのまま入力していて大変な手間だったのですが。

しかし質問文に記したサイトも、元はソース記述作業時に手入力しているでしょうが、そのときには数字の塊を打っているのではないのですか?
現場は具体的にはどのようになっているのでしょうか。

言語パックの類やソフトは具体的にはたとえばどのようなものがあるのでしょうか。

「ユニコードで入力す」るというのは、例えば視覚的にはどういった作業を指しているのでしょうか。これを出力する段階とは、実際のPC等の物体を説明に用いれば、どのような場面を想像すればよろしいでしょうか。

お礼日時:2014/02/08 21:33

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!