Hideyuki SHIRAI ( 白井秀行 )
shira****@meado*****
2010年 6月 7日 (月) 22:49:21 JST
こんにちは、白井です。 From: Jun Oizumi <vagus****@gmail*****> さん曰く Subject: [Anthy-dev 3735] Re: 郵便番号のデータ Message-ID: <AANLkTin_iy-Yo****@mail*****> Date: Mon, 31 May 2010 18:22:02 +0900 > http://sourceforge.jp/projects/alt-cannadic/downloads/47681/zipdic-201005.tar.bz2/ > > 一応、参考のために自分が使っていた変換スクリプトも入れておきました。 > (私はプログラマではないので、あまり人の目には晒したくないのですが、 > 元データが非常に厄介なものなので、参考になればと。) 以前から、たまに SDIC(*1)用の郵便番号辞書を作ったりすることがあ るのですが、大泉さんのスクリプトに発破をかけられて一発で SDIC 用 の辞書を作るところまでやってみました。 (*1) http://www.namazu.org/~tsuchiya/sdic/ そのときに、スクリプトを参考にさせていただいて気づいた点です。 >> elsif item[3] == "新所・岡崎・梅田入会地" >> # これだけなぜか中黒 ちょっと気になったので調べてみましたが、「静岡県湖西市新所・岡崎・ 梅田入会地」という住所がありました :-) http://maps.google.co.jp/maps?ie=UTF8&q=%E9%9D%99%E5%B2%A1%E7%9C%8C%E6%B9%96%E8%A5%BF%E5%B8%82%E6%96%B0%E6%89%80%E3%83%BB%E5%B2%A1%E5%B4%8E%E3%83%BB%E6%A2%85%E7%94%B0%E5%85%A5%E4%BC%9A%E5%9C%B0&fb=1&gl=jp&ei=4d4MTL-xC5GfcbeiqYQO&ved=0CBUQ8gEwAA&lr=lang_ja&hl=ja&view=map&geocode=FU_lEQIdiAwyCA&split=0&sll=34.730891,137.498474&sspn=0.031069,0.040759&hq=&hnear=%E9%9D%99%E5%B2%A1%E7%9C%8C%E6%B9%96%E8%A5%BF%E5%B8%82%E6%96%B0%E6%89%80%E3%83%BB%E5%B2%A1%E5%B4%8E%E3%83%BB%E6%A2%85%E7%94%B0%E5%85%A5%E4%BC%9A%E5%9C%B0&ll=34.726818,137.498231&spn=0.009558,0.017767&z=16&brcurrent=3,0x601b2b9750bcd473:0xb112fd9b356c3a60,0 # 日本は広い!! >> # (JIGYOSYO.CSV は一部、第3水準の漢字を使っていて、EUC-JP に変換できないので >> # 入れない。) こちらも調べて見たところ、 郵便番号 事業所名 2138522 . "あすか製薬(株) 川崎事業所" ;; 「崎」が「立」 9508732 . "大塚製薬(株) 新潟出張所" ;; 「塚」に点付き 5141293 . "(医)ショウ純会 榊原温泉病院" ;; 「日章 U+66B2」ってどの文字にすればよいのか? 9558655 . "(株)高儀" ;; はしご高 9590595 . "(株)高儀" ;; はしご高 の四種類、五点だけでした。これ以上例外が増えないようならば、郵便 番号でのスペシャル扱いでなんとか出来そうです。上の二つは郵政のチョ ンボかな? SDIC 用を改造して、ついでに (^^;) zipcode.t も作ってみたのですが、 もう一息かなぁ。SDIC で使う方は "( )" の中身とかもそのまま表示し ちゃっているのですが、なるたけ anthy でも "( )" 内を使えるように したいなぁ〜、とか野望を抱いています。 -- 白井秀行 (mailto:shira****@meado*****)