Linuxの日本語入力/Mozc用の郵便番号辞書

軽量Linuxをインストールして日本語化、日本語入力を使えるようにしました。Google日本語入力システムのオープンソース版Mozc(もずく)を使っての日本語入力はなかなか快適です。

郵便番号から変換できない

ところが、郵便番号から住所に変換しようとしてもできません。
Mozcのプロパティの辞書の[特殊変換]>[郵便番号変換]にチェックが入っているのですが変換できません。
zipcode_j0

郵便番号辞書がない

郵便番号変換ができない原因は、郵便番号辞書がなかったためでした。
Google日本語入力には搭載されていた郵便番号辞書が、オープンソース版のMozcにはありません。

無いものは作る

無いのであれば、どこかで辞書を探すか、それとも作るしかありません。
「日本郵便株式会社」のサイトに郵便番号と住所のデータがあります。今回はそのデーターを使って辞書ファイルを作ってみました。

Zipcode_J_Mzc (郵便番号もずく辞書)
zipcode_j_mzc.zip Googleドライブのページへ
dic_googledoc1

郵便番号辞書のインストール

Googleドライブのファイルメニューからダウンロード。
dic_googledoc2

アーカイブには3つのファイルが入っています。
Zipcode_J_Mzc
 ┣ Readme_J.txt
 ┣ zipcode_j_3_4.txt
 ┗ zipcode_j_7.txt
辞書ファイルはハイフン有無により2種類。
・zipcode_j_3_4.txt
 郵便番号がハイフンでつながれた123-4567の形式で入力し変換する辞書
・zipcode_j_7.txt
 郵便番号がハイフンなしの7桁の数字1234567の形式で入力し変換する辞書

Mozc辞書ツールを起動しメニューの[管理]>[新規辞書にインポート]を選択。
zipcode_j2

どちらかの辞書ファイルを新しい辞書としてインポートします。
zipcode_j1

インポート終了。
zipcode_j3

ハイフンなしの辞書をインストールすると、このように郵便番号の7桁の数字を入力して変換できます。
zipcode_j4

おまけの機能

変換される住所とは別に、コメントとして「郵便番号データダウンロード」からダウンロードしたファイルに含まれていた読み仮名データを入れてあります。
コメントは変換中に用例として表示することができるので、難読住所の読み方を調べることができます。ただし、基になってるデータが完全ではありませんので、すべての地名の読みをカバーしているわけではありません。
zipcode_j5

「覆盆子原」は「いちごはら」と読むんですね。
zipcode_j6

●ライセンス
———-
この「Zipcode_J_Mzc (郵便番号もずく辞書)」のライセンスは、CC0(Creative Commons Zero:クリエイティブ・コモンズ・ゼロ)です。

CC0
To the extent possible under law, 伊東利光 has waived all copyright and related or neighboring rights to郵便番号もずく辞書.This work is published from:日本.

クリエイティブ・コモンズ・ライセンスに基づいて著作権やそれに隣接、関連する権利を全て放棄しています。
再配布・移植・改良は自由にしていただいて結構です。

※免責事項
———–
「Zipcode_J_Mzc (郵便番号もずく辞書)」のご利用については一切のサポートをしておりません。
「Zipcode_J_Mzc (郵便番号もずく辞書)」の適合性・正確性についての保証はありません。
「Zipcode_J_Mzc (郵便番号もずく辞書)」によって生じるいかなる不具合、トラブルや損害の責任を負いかねますので、自己責任でのご利用をお願いします。