« ドイツ語多読本:Wulf Dorn: Die Nacht gehört den Wölfen | トップページ | Kobo: FW3.19.5613 アップデート & パッチ、スクリーンセーバー »

2015年12月 7日 (月)

フリーの辞書をKindle用辞書に変換

辞書変換ツールのpenelopeが最近mobiに対応した。

Kindleのドイツ語辞書はDudenの他に、最近ではOxford German-English Dictionaryもダウンロードできるようになったし、なんならCollinsやPonsの独英辞典を購入・追加もできるので、あえてフリーの辞書を入れることもないのだが、興味本位で。

Penelope 3.1.1
https://github.com/pettarin/penelope
もしくは
https://pypi.python.org/pypi/penelope/

mobi対応といっても、他の辞書をKindleのmobiに変換するだけ。Kindleの辞書を他の形式に変換することはできない。そもそもKindleの辞書にはDRMがかかっているし。

◎準備:
Pythonは2.7.xもしくは3.4.x以上。
pipでインストールできるようになったので、インストールは簡単。
以下の作業はlinuxで。

(と思ったが、うちの長期サポートのubuntu 12.04は古いせいか、Pythonはpip未対応。仕方がないので、python-3.4.3のソースをダウンロードしてビルドした。なので、下の"pip install ..." はすべて"pip3 install ..."で行った。)

1. penelopeのインストール

$ sudo pip install penelope

他に必要なものもpipでインストール可。

$ sudo pip install marisa-trie
Koboの辞書の読み出し・書き出しに必要(昔のようにMARISAのビルドの必要はなくなった)

$ sudo pip install lxml
xmlの読み出し・書き出しに必要

$ sudo apt-get install dictzip
stardictの辞書作成にdictzipが必要

2.mobi作成ツールをアマゾンからダウンロードして、パスの通ったところへコピー(/usr/local/bin/など適宜)。
kindlegen
https://www.amazon.com/gp/feature.html?docId=1000765211


◎辞書の変換
変換した辞書は、以前kobo用の辞書に使ったbabylonの独英をstardict形式に変換したもの(「Kobo: フリーの辞書をKoboの辞書に変換」参照)
kobo形式の辞書からの変換はうまくいかなかった。

1.stardictの辞書は、*.dict.dz、*.idx、*.ifo、*.synに分かれているので、それをzipにまとめておく。

$ zip babylon_ger-en_stardict.zip NEW_Babylon_German_English_dictionary.dict.dz NEW_Babylon_German_English_dictionary.idx NEW_Babylon_German_English_dictionary.ifo NEW_Babylon_German_English_dictionary.syn

2.あとはpenelopeの実行

$ penelope -i babylon_ger-en_stardict.zip -j stardict -f de -t en -p mobi -o ger_en_babylon.mobi --title "Babylon German-English dictionary"

これでとりあえずはできあがるが、kindleに持っていて使ってみたところ、人称変化や格変化などの語形変化にまったく対応していない。これでは使い物にならない。

が、penelopeのオプションをもう一度確認すると、--flatten-synonyms ってやつがある。同義語も見出し語にしてエントリーを追加するものらしい。

試しにやってみると、

$ penelope -i babylon_ger-en_stardict.zip -j stardict -f de -t en -p mobi -o ger_en_babylon_flatten.mobi --title "Babylon German-English dictionary" --flatten-synonyms

語形変化に対応した辞書ができあがった。いろんな変化形は同義語扱いになっているようだ(*.synファイルか)。
ただしファイルサイズは大きくなる。変化形毎に同じ語義エントリーを繰り返すわけだから、辞書は大きくなってしまう。

--flatten-synonymsなしの場合は、21M、
--flatten-synonymsありの場合は、65Mの辞書サイズになった。かなりでかい。

語形変化に対応していない辞書は使えないから仕方ないが、Kobo形式に変換した辞書だと語形変化に対応していてもサイズは12M。もう少しなんとかならないかな。

|

« ドイツ語多読本:Wulf Dorn: Die Nacht gehört den Wölfen | トップページ | Kobo: FW3.19.5613 アップデート & パッチ、スクリーンセーバー »

Kindle」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/592212/62820886

この記事へのトラックバック一覧です: フリーの辞書をKindle用辞書に変換:

« ドイツ語多読本:Wulf Dorn: Die Nacht gehört den Wölfen | トップページ | Kobo: FW3.19.5613 アップデート & パッチ、スクリーンセーバー »