RETURN

■Zaurus の楽しみ方



■広辞苑を持ち歩きたい編

■ 再三書いていますけど、テキストが好きなんです。読むのも書くのも。テキスト好きの人ならボクの気持を解ってもらえると思うんですが、できることなら広辞苑を持って歩きたい……。
 3万円ほど出せば、携帯タイプの広辞苑搭載の電子辞書が買えます。でも、e-Zaurusと2つ持つのは億劫。なんとかならんものでしょうか?

 休みの朝、惰眠をむさぼりながら考えました。

 電子ブックの広辞苑からテキストデータを吸い出せないものだろうか。もしできたら、TTVブックリーダーで閲覧できる。検索に手間がかかるけど、広辞苑をe-Zaurusで持ち歩くことができる。

 さっそく、インターネットで調べてみますと、ボクが考えることぐらい、とおの昔にやっちゃた人達がいるんですね。手間はかかりましたが簡単に広辞苑をe-Zaurusに載せることができました。




 統合辞書は別売

「統合辞典」
MI-P2搭載の統合辞典

 過去のZaurusシリーズには統合辞典が標準で搭載されていました。ところが、コストダウンのために初代igeti辺りから別売。e-Zaurusにも装備されていません(MI−E21では付属のCD−ROMに収録されています)。必要のな人には不満でしょうが、必要でない人には本体の価格が下がるわけですから助かります。

 でも、ボクは欲しい。あると便利です。
 で、MOREソフトという形で提供される統合辞典をダウンロードしようかと思ったのですが、なんと縦対応していないというではありませんか。辞書を引く度に横に持ち帰るのは不便。シャープの手抜きとしか思えません。1,500円という価格は、電卓スタイルの電子辞書を思えば高くはないですが、横表示には納得できません。ま、そのうち縦対応版が出るだろうと思い、購入は中止しました(MI−E21付属のCD−ROMに収録されている統合辞典は縦型です)。
 しかし、半年たっても縦対応版は発売されず。仕事用のカバンには統合辞典標準装備の2代目igetiMI−P2がありますので、そちらを使っていましたが、やはりe-Zaurusでも辞書を使いたい。

 ってんで、e-Zaurus電子辞書化計画を実行に移すことにしました。

■ 正直な話、e-Zaurusに辞書を載せたいなら素直に統合辞典を購入した方が賢いです。他のアプリケーションとの連携も可能ですし、前方一致などオプション付の検索が可能です。
 しかし、辞書の中身は知れています。ちょいと意味を知りたい、英語でなんていうんだろう、という程度なら十分ですが、もっと詳しく知りたいと思うとやはり物足りません。ボクの場合、活字中毒の友、広辞苑をe-Zaurusに載せたいのでがんばりました。
 広辞苑まで必要のない人はコーヒー4、5杯我慢して、統合辞典をダウンロードしてください(MI−E21、E25DCでは付属のCD−ROMに収録されています)。




 まずは先達のみなさまに感謝

 なんとか広辞苑をe-Zaurusに載せることができました。これも先達のみなさんが作業の記録を公開されてくださったおかげです。大変なご苦労と手間があったことと思います。この場を借りまして、先達のみなさん、およびMOREソフト製作者さんに御礼申し上げます。

「電子辞書にしてしまおう」でお世話になったサイト(敬称略)
Final β Laboratory
幾霜
3D Linux Unknown
フリーソフトウエア・フルパワー全開ページ
電子辞書検索ソフトDDwinのページ
PPDIC Home Page

 ということは、上記のみなさんのサイトを覗けば広辞苑をe-Zaurusに載せられるわけで、無駄口に付き合う気のないみなさんは、上から4サイトをご覧になられることをオススメします。

尚、上記のサイトへのリンクに際し、一部のサイトを覗いてリンクの許可、リンクの連絡をしておりません。みなさん、リンクフリーを公言されているからです。もし、何か私家版携帯端末考の記述にクレームなどありましたら、こちらまでメール下さい。迅速に適切な処置をいたします。




 必要なものを揃えましょう

 作業は、

  1. 電子ブックからテキストデータを吸い出し
  2. PDIC一行テキスト形式へ変換して
  3. さらにPDIC形式に変換し
  4. e-ZaurusのMOREソフトZPDVIEWで読み込む

 という手順です。
 この手順は広辞苑第四版(電子ブック版)以外の辞書でも同じです。英和、和英辞典なんかもできちゃいます。参考にしてチャレンジしてください。

 では、必要なツール類をご紹介。

e-ZaurusとメモリカードとWindowsパソコン
 e-Zaurusは当たり前。
 広辞苑のデータは30MBを越えますので、本体のメモリには当然入りません。大容量のメモリカード(CFでもSDでも可)が必要です。
 Windowsパソコンは電子ブックからテキストを吸い出すのに必要。MAC方面は解りません。
広辞苑第四版(電子ブック版)
 ここで紹介するのは電子ブック版の広辞苑第四版をe-Zaurusで参照するための方法です。となると、電子ブック版広辞苑第四版は必須ですね。がんばって探して購入してください。
 他にものちほど紹介するDDWinで読み込みできる電子ブック、EPWING規約のCD−ROMなら応用可能のようです。
 現在、購入可能な第五版も可能のようです。ボクは電子ブック版を持っているので試しましたが、DDWinからの書き出し段階でうまくいきませんでした。書き出したファイルが1.6GBになるのです。CD−ROM版ならうまくいくのかも。第五版に関してはこちら〔a hermitage〕さんを参考にしてください。手順は第四版と同じですが、PDIC形式に変換するために使うスクリプトが違います。第五版用のスクリプトもそちらにあります。
辞書検索ソフトDDwin
 電子ブック、およびEPWING規約のCD−ROMをWindows環境で検索するソフトです。こいつを使ってCD−ROMからテキスト部分を抜き出します。
PDIC for Windows
 辞書検索・語学学習・辞書作成ソフトウェア。テキスト・データをPDIC形式に変換します。
ZPDVIEW
 ザウルスでPDIC形式の辞書を検索するMOREソフト
 現在、作者さんの都合でザウルス関係のページが休止しております。問い合わせしますとリンクOKの返事をいただきましたので、ZPDVIEWはこちらから。

 以下はあったら便利なもの、楽なものです。

TTVブックリーダー
 お馴染みe-Zaurusのテキストビューワ。上記のZPDVIEWを入手できなかった方は、こちらをどうぞ。30MBを越える広辞苑のテキストファイルも読めました。検索機能があるので、なんとか広辞苑を引くことができます。
広辞苑第四版用の外字変換テーブル
 広辞苑をテキストデータに変換すると、外字の部分が文字コードで出力されます。これを見易くするには外字変換テーブルを用意すると楽です。〔Final β Laboratory〕さんの〔窓辺の書斎〕→〔ポケットに広辞苑を〕の中に外字変換テーブルがあります。
 第五版をPDIC形式に変換するためのスクリプトはこちら〔a hermitage〕さんにあります。
Wzエディタ
 抽出したテキストデータを成形するのに使います。30MB近いデータを扱いますので、それなりにタフなエディタが必要。マクロ機能があるともっと便利。




 電子ブックからテキストデータを吸い出す

■ まず、辞書検索ソフトDDwinを使って電子ブック版の広辞苑第四版からテキストデータを取り出します。

  1.  まずはDDwin(ver2.59)をインストール。

  2.  DDwinに電子ブックの広辞苑第四版を読み込ませます。
     DDwinを起動させ、〔ファイル〕〔辞書をサーチする〕で電子ブックを入れたCD−ROMドライブを指定。〔辞書名バー〕(ツールバーの下)に〔広辞苑〕という表記が出ますので、〔広辞苑〕を選択します。

  3.  外字変換テーブルを用意された方は外字変換テーブル・ファイルを指定します。
     
    ※この作業は必須ではありませんが、やっておいた方が見易くなります。
     広辞苑では外字を利用していますが、e-Zaurusでは表示されません。そこで、外字を適当な文字に置換えておく必要があります。テキストデータ化の後にエディタなどで置換えていってもいいのですが、面倒ですので外字変換テーブルを使って一気にやっちゃいましょう。

     まず、入手もしくは作成した外字変換テーブルのファイルをDDwinをインストールしたフォルダに置きます。
    辞書個別指定ファイルDDwin.DAT
    [広辞苑 第四版 電子ブック版]
    Include=koujien4.gjt
     次にDDwinツールバーの〔ツール〕〔辞書個別指定〕で設定ファイルを開きます。下の方に[広辞苑 第四版 電子ブック版]という表記があるはずです。そこに外字変換テーブル・ファイルを指定します。左のように外字変換テーブルのファイル名を指定してください。この例では”koujien4.gjt”という名の外字変換テーブルを指定しています。

  4.  抽出するテキストの範囲を指定します。テキスト全文が必要ですので全文を指定します。
     〔ツール〕〔全文検索〕を選択。検索モード選択タグで〔全文〕を選択してもかまいません。
     全文検索モードで検索キーワードを空白のまま〔検索〕のアイコンをクリックして検索スタート。数十秒で全文の内容が表示されます。

  5.  指定した内容のテキスト・ファイルを作成します。
     ツールバーの〔編集〕〔エディタ起動〕でエディタ起動のタグが開きます。
     〔ファイル名〕は任意のファイル名、”kojien.txt”などを指定してください。
     〔出力する内容〕〔該当項目すべて〕をチェックします。
     〔OK〕をクリックすると数十秒でテキストデータが取り出され、エディタで表示されます。この時点で、〔ファイル名〕で指定したファイル名で広辞苑のテキスト・ファイルが作成されています。ボクの場合、27.1MBのファイルになりました。




 PDIC一行テキスト形式へ変換しましょう

 電子ブックからテキストを抽出しただけではPDIC形式に変換できません。事前準備が必要です。

 e-ZaurusのMOREソフトZPDVIEWで広辞苑を検索できるようにするためには、PDIC形式の辞書ファイルが必要です。PDIC形式への変換は、PDIC for Windowsを使いますが、その下準備としてPDIC一行テキスト形式の辞書ファイルを用意しなければなりません。つまり、〔DDwinの出力データ〕→〔PDIC一行テキスト形式〕→〔PDIC形式〕という辞書ファイルの変換が必要なのです。

 はっきりいって、DDwinの出力ファイルからPDIC一行テキスト形式への変換は手間がかかります。Perlやエディタのマクロを使う必要があります。Perlとかマクロと聞いてピンとこない人には難しいかも知れません。
 PDIC一行テキスト形式への変換を飛ばして、DDwin出力ファイルから直接PDIC形式のファイルを作成することも可能です。ただし、その場合、670語近くの語句が欠落します。そんな細かいことは気にしない、という方は、このステップを飛ばしてもかまいません。
 特にZPDVIEWにこだわりがなければ、DDwinで吸い出したテキストをそのままTTVブックリーダーで読むという方法があります。TTVブックリーダーには検索機能がありますので、辞書引きは可能です。

 PDIC一行テキスト形式とはどんな形式でしょうか。詳しくはPDIC for Windowsのホームページで調べてもらえるといいでしょう。ここでは基本的な部分だけ紹介しておきます。

見出し語 /// 意味その1 \ 意味その2(改行)

 赤い下線部がミソです。見出し語と意味の部分は” /// ”(/3つを半角スペースで挟む)で区切ります。意味が複数ある場合、” \ ”(\を半角スペースで挟む)で区切り、最後に改行コード。これで一語です。

 DDwinで出力したデータは左のような形式になっています。これを右のPDIC一行テキスト形式へと変換するのです。手作業では埒があきませんので、Perlやエディタのマクロを使って一括処理します。

成形前(DDwinの出力のまま) 成形後(PDIC一行テキスト形式)
あいうち【相撃ち・相打ち・相討ち】アヒ‥
 (1)二人で同時に物を打つこと。
 (2)敵味方双方が同時に相手をうつこと。転じて、勝ち負けのないこと。あいこ。「―になる」
 (3)一人の敵を味方二人で一緒に討つこと。

あいつ【相撃つ・相打つ】アヒ‥
 自五 互いに打ち合う。「肉弾―・つ」

あいえ【藍絵】アイエ
 (1)藍を主色とし、他の色を抑制して摺った版画。江戸末期に行われ、葛飾北斎・歌川国貞などの作品に見られる。藍摺(あいずり)。紅嫌い。
 (2)陶磁器に呉須(ごす)を用いた藍色の絵模様。
あいうち【相撃ち相打ち相討ち】アヒ‥ /// (1)二人で同時に物を打つこと。 \ (2)敵味方双方が同時に相手をうつこと。転じて、勝ち負けのないこと。あいこ。「―になる」 \ (3)一人の敵を味方二人で一緒に討つこと。
あいうつ【相撃つ相打つ】アヒ‥ /// 自五 互いに打ち合う。「肉弾―つ」
あいえ【藍絵】アイエ /// (1)藍を主色とし、他の色を抑制して摺った版画。江戸末期に行われ、葛飾北斎歌川国貞などの作品に見られる。藍摺(あいずり)。紅嫌い。 \ (2)陶磁器に呉須(ごす)を用いた藍色の絵模様。

 もう一つ、成形するべき場所があります。見出し語の音節(?)を区切っている””と”-”の部分です。検索するときにじゃまになるので削除する必要があります。これは簡単。お手持ちのエディタの置換を使ってください。”・”と”-”を文字無しに置換えればOKです。

 それでは元気のある人だけPDIC一行テキスト形式への変換をやってみましょう。
 方法にはPerlのスクリプトを使う方法と、Wzエディタ等のマクロを使う方法があります。

■ Perlのスクリプトを使う方法
 Perlを使うには、まず、Perlをパソコンにインストールし、バッチを当てて日本語化し、DOSプロンプトでスクリプトを実行する――という手間が必要です。それもPerlスクリプトを持っていることが前提条件。解る人はやってください。解んない人はチャレンジするか、諦めましょう。

 Perlのインストール、日本語化は、Perl初心者の部屋のサイトを参考にしてください。
 PDIC一行テキスト形式へ変換するスクリプトは、〔幾霜〕→〔Computing考察記〕→〔DDwinで閲覧できる辞書をPDIC形式に変換する〕にあります。このスクリプトを使うと、ひらがな、漢字両方で検索が可能となります。スクリプトはバッチファイルになっていますので、Perlさへ導入すれば、面倒なDOSプロンプトに下りる必要はありません。バッチファイルをクリックするだけ。数分で変換されます。オススメ

kojien.txc
main(TX* text){
jumpfiletop();
while ( txIsCurEof(text) == 0 ) {
if ( txGetChar(text) == ' ' ) {
txDeletePrev(text);
txInsert(text," \\ ");
txNextPara(text);
} else {
if (txIsCurReturn(text)==0) {
txJumpParaEnd(text);
txDeleteChar(text);
txInsert(text," /// ");
txNextPara(text);
} else {
txDeletePrev(text);
txNextPara(text);
} } } }
■ Wzエディタのマクロを使う方法
 ボクはこの方法でやりました。上で紹介したPerlスクリプトも試しましたが、自分でやってみたかったもので……。久しぶりにマクロを組んだので、単純なものなのに一時間ほどかかりました。でもって、マクロの作業時間が50分ほど。ペンティアムIIIの800MHzメモリ256MBでこの時間。CPUから煙が出るんじゃないかと思いました。
 ということで、ボクが組んだ幼稚なマクロを載せておきます。参考にしてください。もしうまくいかなくても文句をいわないように。利用する場合は自己責任です。

 尚、もっと高度なWzエディタ用のマクロがあります。〔Final β Laboratory〕→〔窓辺の書斎〕→〔ポケットに広辞苑を〕にあります。こっちの方がいいでしょう。

 で、最後の方にどうでもいい附録があります。歴代首相の名前とか、十二支とか。辞書としては必要ないので削除しちゃいましょう。どうしても欲しい人は別のテキストファイルとして保存した方が参照しやすいと思います。ZPDVIEWでは検索できないでしょうから。




 PDIC形式へ変換しましょう

 ここまで来れば後は簡単。PDIC for Windowsにお任せです。■

  1.  PDIC for Windowsを起動します。
  2.  〔Tools〕〔辞書の変換〕とたどります。
  3.  〔転送元辞書〕の〔ファイル形式〕は〔一行テキスト形式〕をチェック。上記で作成したPDIC一行テキスト形式の辞書ファイルを指定します(一行テキスト形式への変換をしていない人は〔PDICテキスト形式〕でどうぞ)。
     〔転送先辞書〕の〔ファイル形式〕は〔PDIC形式〕をチェック。任意のファイル名を指定してください。
     〔同一単語の処理〕は〔改行付きで付け加える〕を選択。
     〔詳細〕では〔辞書格納率〕を100%にするとよいそうです。あと、〔一行テキスト形式の区切〕が” /// ”になっているか確認しておきましょう。
     〔登録項目〕は面倒なんで全部チェック。〔日本語訳部〕さへチェックしておけばいいと思うけど。
     で、〔OK〕。
  4.  〔辞書の新規作成〕が開いたら、〔辞書の種類〕の〔Hyper辞書形式〕をチェック。〔圧縮対応の辞書にする〕はチェックを外します
     で。〔OK〕。
  5.  まつこと十数分。PDIC形式の広辞苑辞書ファイルの完成です。




 e-ZaurusのMOREソフトZPDVIEWで読み込む

■ あとは辞書ファイルをe-Zaurus用メモリカードに転送するだけです。
 このとき、ファイル名を変更するのをお忘れなく。詳しくはMOREソフトZPDVIEWのマニュアルにありますが、辞書ファイル名を”WOBP0000.DAT”〜”WOBP0011.DAT”へ変更しておく必要があります。つまり、ZPDVIEWは12個の辞書を扱えるということです。拡張子は”DAT”ですんでお間違いなく。

 当然ですけど、e-ZaurusにZPDVIEWをインストールするのをお忘れなく。起動しますとほら、ご覧の通り。

 ファイルサイズですが、〔幾霜〕さんのところにあるPerlスクリプトを使うと、最終的に40.0MBになりました。ボクのWZエディタ用マクロで作ると31.4MBです。
 サイズの違いは、使い勝手の差です。幾霜版辞書ファイルは、ひらがな、漢字の両方で検索でき、見易いようにいろいろ心配りされています。ボクのマクロは手抜きなんで、物草版辞書ファイルではひらがな検索しかできません
 オススメは幾霜版辞書ファイルです。結局、ボクも幾霜版を利用しています。




 他にも辞書がいっぱい

国語辞典
■
英和辞典
■
 電子ブック版の広辞苑をPDIC形式の辞書ファイルに変換し、e-Zaurusの辞書検索ソフトZPDVIEWで使用する手順を紹介しましたが、同じ方法でたくさんの辞書ファイルを作成できます。基本的にDDwinで読み込める辞書ならPDIC形式への変換は可能なのです。
  ハードディスクをDDwinでサーチしてみますと、学研の国語、英語、和英、漢和辞典が見つかりました。入手先は覚えていません。多分、翻訳ソフトに付いてきたものだと思います。この学研の辞典なんですが、どうやらe-Zaurusの統合辞典と同じもののようです。さっそく広辞苑と同じ手順でPDIC形式に変換してみました。
 漢字辞典はあまり使い道がなさそうです。英和辞典は発音記号の外字の処理が煩雑。ということで、国語、和英辞典をe-Zaurusで使用することにしました。
和英辞典
■
 国語、和英とくればやっぱり英和辞典が要りますよね。
 ってんでいろいろ探してみますと、「GENE95 辞書」なるものを見つけました。こちらはフリー。誰でも入手できます。PDICテキスト形式になってますので、PDIC for Windowsさえあれば簡単にPDIC形式に変換できます。
百科辞書
■

 ここまでくると欲がでてきまして、他に面白い辞書がないかと探してみましたら、「私立PDD図書館」なるところで「百科辞書」という楽しい辞書を見つけました。ダウンロードにちょいと手間がかかりますが、テキスト形式ですので、加工しなくてもそのままTTVブックリーダーで見ることができます。
 PDIC形式に変換してみたいかたは、例によって他のサイトを参考にしてください。幾霜さんところと3D Linux Unknownさんところにバッチリ書いてあります。Perlが必須ですんで念のため。ロハでこれだけの辞書を使えるのですから、多少の手間や苦労は我慢しましょう。やり方が解るだけでも幸せです。いや本当に先達には感謝しております。

 他にも楽しい辞典があるかも知れません。みなさんからご紹介いただけると幸いです。

2002/1/2






BACK