[mecab-users 180] Re: feature.defの書き方について

Back to archive index

Taku Kudo taku****@chase*****
2006年 10月 26日 (木) 01:03:48 JST


工藤です

> 「オリジナル辞書/コーパスからのパラメータ推定」のページを見ながら
> 作業をしていて気になったのですが,
> feature.defの記述方法の例の中で,「/」と「,」の違いが分かりません.
>
> UNIGRAM W1:%F[0]/%F[6]
> BIGRAM B01:%L[0],%L?[1]/%R[0]
>
> と記述するのと,
>
> UNIGRAM W1:%F[0],%F[6]
> BIGRAM B01:%L[0],%L?[1],%R[0]
>
> と記述するのでは何か違いがあるのでしょうか?
> BIGRAM の方を見ると,左文脈の素性と右文脈の素性を分けるために
> 使っているように見えるのですが,

その通りです。機械的には区別ありません。可読性のみです、

> この考え方だと UNIGRAM の方に使われている「/」が何なのか分からなくなってしまいます.

HMM の慣習に従っています。HMM は 出力シンボルと hidden シンボルのペアから
emission 確率を計算します。/ はこれらの二つのデリミタとして使っています。

繰り返しになりますが、, でも / でも内部的には同じです。

-- taku



mecab-users メーリングリストの案内
Back to archive index