[Anthy-dev 2472] name.t の typo 修正

Back to archive index

UTUMI Hirosi utuhi****@yahoo*****
2005年 9月 29日 (木) 17:40:14 JST


内海です。

name.t にいくつか typo を混ぜていました。
修正しましたので merge をお願いします。

gcanna.ctd に関しては作業に当たって心がけたことを
anthy_gcanna_ut-20050929 の README.ja に書きました。
よく使う語を十語くらい修正するだけでも、使い勝手が
変わってくると思います。

# ***********************************************************
# 辞書の作りかた
# ***********************************************************

辞書はすぐに古くなるので、多くの方が引き継いでくださると
うれしいです。

辞書の形式は次の通り。
読み 品詞 第一候補 第二候補...

(例)
どうじょう #T35*134 同上 #T30*126 同情 #T30*123 同乗

"*134" などの頻度は Canna 用のものなので、
Anthy では必要ありません。
従って次のような形でも結果は同じになります。
どうじょう #T35 同上 #T30 同情 同乗

品詞記号については同梱の canna_hinsi.txt を参照してください。

Anthy では複合語を登録することもできます。
これは Anthy の人名辞書 (name.t) などで利用されています。
形式は次の通り。
おだかずまさ #JN #_2小田_4和正

"_2小田" が "おだ" の 2文字分に対応し、
"_4和正" が "かずまさ" の 4文字分に対応します。

# ***********************************************************
# 改変の方針
# ***********************************************************

全体的には表記を丸く現代的にすることを目指しています。

1. 日常的に使われている表記を追加する
      現状の候補:     昼ごはん 昼御飯
      改変後の候補:   昼ご飯 昼ごはん 昼御飯

2. 候補の並びを Google のヒット数の順番にする
   (恣意的に設定しない)
   ただし漢字二文字のような場合は適切にヒット数が
   出ないこともあるので、明らかに不適切なときは
   手を加える。
      変更前: #T15*117 正正堂堂 #T15*116 正々堂々
      変更後: #T15*117 正々堂々 #T15*116 正正堂堂

3. 単語を追加するときは自分の好みだけで追加しない
      例えば歌手名を追加するときは過去の売上げランキングの
      上位のものを追加する。あまりにもマイナーなものは足さない。
      自分の趣味のジャンルの単語ばかり追加しない。
      特殊な語を入れすぎると前後の単語の繋がり次第で
      誤変換を起こすかもしれない。


--------------------------------------
Know more about Breast Cancer
http://pr.mail.yahoo.co.jp/pinkribbon/
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: name.t_20050929.diff.bz2
型:         application/x-bzip2
サイズ:     1076 バイト
説明:       name.t_20050929.diff.bz2
下载 


Anthy-dev メーリングリストの案内
Back to archive index