任务单 #27694

隣接コストの不具合

开放日期: 2012-02-26 00:49 最后更新: 2012-02-27 12:20

报告人:
属主:
(无)
类型:
状态:
关闭
组件:
(无)
里程碑:
(无)
优先:
5 - Medium
严重性:
5 - Medium
处理结果:
文件:

Details

Java版Igo0.4.3に自作辞書を読み込ませたところ、思うような結果が得られません。

読みにくく加工(あ行をガ行に置換するなど)した日本語の文章を、元の文章に戻すということをやっていました。 MeCabで動作確認したものをIgoを使ったものに移植したのですが、動作が大きく異なります。

  • 「ギボヂヂソギギダバ」→「命拾いしたか(MeCab)」「命拾い下か(Igo)」
  • 「ボセパクウガンデスド」→「これはクウガのベルト(MeCab)」「これ羽クウガのてると(Igo)」

文法を考慮して変換を行うために形態素解析を行なっているのですが、Igo版では文法を無視した変換をしてしまいます。 詳細は http://shogo82148.hatenablog.com/entry/2012/02/25/233542 に書きました。使用した辞書は https://github.com/shogo82148/Grongish から入手可能です。

trunkのコードを確認したところ、隣接コストの計算に間違いがあるように思います。 確認をお願いします。

任务单历史 (3/3 Histories)

2012-02-26 00:49 Updated by: shogo82148
  • New Ticket "隣接コストの不具合" created
2012-02-27 12:20 Updated by: phjgt
评论

r108で対応。

原因: ・以下の二つのクラスでの隣接コストマトリックスの添字計算方法が間違っていた
 ・net.reduls.igo.dictionary.build.Matrix
 ・net.reduls.igo.dictionary.Matrix

誤: Matrix[左品詞ID*左品詞数 + 右品詞ID]  
正: Matrix[左品詞ID*右品詞数 + 右品詞ID]  ※ => Matrix[左品詞ID][右品詞ID]
2012-02-27 12:20 Updated by: phjgt
  • 状态 Update from 开启 to 关闭
  • Ticket Close date is changed to 2012-02-27 12:20

Attachment File List

No attachments

编辑

You are not logged in. I you are not logged in, your comment will be treated as an anonymous post. » 登录名