プロが教える店舗&オフィスのセキュリティ対策術

「Collins コウビルド米語版英英和辞典」や、「ケンブリッジ英英和辞典」に付属のCD-ROMをPDIC変換できますか? また、参考となるHPがあれば教えてください。

A 回答 (1件)

こんばんは。



両方の辞書とも、著作権はともかく、国内外で、すでにデータの抜き出しは可能のようです。

国内ですと、EPWING用に変換というものもあるはずです。PDICにも利用できますね。そこで以下のような一覧があります。

http://kazuo.fc2web.com/dic/ddwin2.htm
かなり古いサイトです。

でも、ここのサイトから学べるものは多いです。
『PDIC辞書化の方法』
https://web.archive.org/web/20090107231246/http: …

ここのサイトはすごいの一言です。
やはり、ストリーム系の言語が必要な気がします。Perlを使っているようです。
この私自身は、逆のPDICから抜き出す作業をしていますが、ActivePerl はあります。ですが、Excelで最終の調整をするために、VBAマクロにBasp21を使うことにしました。Perl系の正規表現が使えるからです。目的は、単熟語の自家製・暗記用の辞書を作成する目的です。

Step1: CD-ROMの内容をテキストファイルに吸い出す
Step2: それをPDICのサポートする形式に変換する
Step3: PDICに取り込みPDIC辞書化する

ここで、Step1 さえ成功すれば、後は、見通しが立ちます。

うみうみ屋さん作「UWSC自動化ソフト」の話が出ていますが、PCを数日間働かせ続けて、物理的にテキストに抜き出す方法です。他に、「EBStudio」の話が出ていますが、私も持っています。その同じサイトで、辞書の解析プログラム「EBDUMP」も出ています。

•CobuildConv.zip (50KB) - Collinsコウビルド英英辞典【改訂第5版 CD-ROM付】JIS X 4081化ツールキット

http://ebstudio.info/home/CobuildConv/index.html

[PDIC 1行テキスト形式]にしてあげるわけです。

またフォーマットの基準はここにもあります。
http://pdic.la.coocan.jp/unicode/help/UtyConvert …

ところが、この私自身は、ここを読んでいれば、もう少し楽だったはずです。
    • good
    • 0
この回答へのお礼

貴重な情報を頂き、ありがとうございました。とても参考になります。

以前、Oxford英英第七版のCDからデータ抽出しようと、Perlインストール(Win7)を試みたのですが、うまくいかず(自PCのHDD不足)、Perlを使用しない他の方法がないか調べておりました。私のコンピュータ知識はとても限られまして、Perlはそれまで触ったことがありませんでした。

私も自家製辞書の快適環境の構築を目指しております。以下の環境での利用はうまく行きました。
英辞郎→PDIC→テキスト出力→VBScript(ASP)でデータをいじって MS Accessへ格納→IIS稼働の自家製サーバに置き、ASPウェブにiPadでつなげてデータ参照。

色々無駄なことをしておりますが、英辞郎と同じようなことを英英和でやりたいと思っています。

頂いた情報とリンク先説明の理解をもっと深める必要がありますが(しっかり理解しきれておりませんが)、PerlなしではStep1はクリアできないのでしょうか?

お礼日時:2016/05/30 22:35

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!