[Anthy-dev 2902] 句点などの扱い

Back to archive index

Hideyuki SHIRAI ( 白井秀行 ) shira****@meado*****
2006年 4月 25日 (火) 17:57:26 JST


白井です。

変換時の句点(。)の扱いですが、anthy-7100b のころと現状では変わっ
たような気がします。なにも学習していない状態で、

7100bのころ: 「かんがえた。」=>「考えた」+「。」

と「。」をひとつの文節に分けていたと思うのですが

現状(7500ぐらい): 「かんがえた。」=>「考えた。」

と、「。」も含めて、ひとつの文節としてします。

# 逆に 7100b では 「。。。」=>「…」ができなかった記憶も。

ちゃんと変換できるものなら、これで問題ないのですが、「。」を含め
て打つと結構すちゃらかな変換をし、なおかつ、うまく学習出来ないよ
うな感じがします。-7622 で試すと、一発目の候補が

「かんじがします。」=> 「感じが」+「縞す。」
「せいきゅうする。」=>「セイキュウスル。」
「おもわれます。」=>「オモワレマス。」

などとなります。しかし、それぞれ、「。」を入力しないと

「感じが」+「染ます」
「請求する」
「思われます」

となります。egg-anthy のせいかな?とも思ったのですが、anthy.el
や UIM でもこうなりました。

また、同様に読点(、)が文節にくっついて変換すると、これまた最初に
おかしな候補が出ることが多いように感じます。

自分で文節を切り直せばよいのですが、結構めんどくさいです。なので、
すべての記号というわけにはいかないでしょうが、句読点や?などの区
切りとなる記号類は別の文節として扱ったほうが変換効率が高くなるの
ではないか?と感じています。

この現象が発生している&気にするのって、もしかして、ぼくだけ?と
いう気もしなくはないのですが。。。

# なぜ今まで疑問に思わなかったかというと、無意識のうちに「、」
# 「。」を単独で入力するようになっていたから、かしら。

-- 
白井秀行 (mailto:shira****@meado*****)



Anthy-dev メーリングリストの案内
Back to archive index