sumom****@users*****
sumom****@users*****
2008年 10月 2日 (木) 17:23:48 JST
Index: julius4/man/ja/accept_check.1 diff -u /dev/null julius4/man/ja/accept_check.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/accept_check.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,95 @@ +.\" Title: + accept_check + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "ACCEPT_CHECK" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + accept_check + \- 文法における単語列の受理/非受理チェック +.SH "概要" +.HP 13 +\fBaccept_check\fR [\-t] [\-s\ \fIspname\fR] [\-v] {prefix} +.SH "DESCRIPTION" +.PP +accept_check は,文法で文の受理・非受理を判定するツールです.文は標準 入力から与えます.受理すべき文を一行ずつテキストファイルにまとめて書い ておき,それをaccept_check の標準入力に与えることで,その文法 (\fIprefix.dfa\fR +および +\fIprefix.dict\fR) において目的の文が受理されるかどうかをバッチ的にチェックできます. +.PP +実行には .dfa, .dict, .term の各ファイルが必要です. あらかじめ +\fBmkdfa.pl\fR +で生成しておいて下さい. +.PP +対象とする文は,文法の語彙単位(.vocaの第1フィールド)で空白で区切って与 えます.最初と最後には多くの場合 +silB, +silE +が必要であることに気をつけて下さい.また, ショートポーズ単語は文に含めないでください. +.PP +同一表記の単語が複数ある場合,accept_check はその可能な解釈の全ての組 み合わせについて調べ,どれか1つのパターンでも受理可能であれば受理,す べてのパターンで受理不可能であれば受理不可能とします. +.SH "OPTIONS" +.PP +\fB \-t \fR +.RS 3n +単語ではなくカテゴリ名で入力・出力する. +.RE +.PP +\fB \-s \fR \fIspname\fR +.RS 3n +スキップすべきショートポーズ単語の名前を指定する. (default: "sp") +.RE +.PP +\fB \-v \fR +.RS 3n +デバッグ出力. +.RE +.SH "EXAMPLES" +.PP +vfr (フィッティングタスク用文法) での実行例: +.sp +.RS 3n +.nf +% accept_check vfr +Reading in dictionary...done +Reading in DFA grammar...done +Mapping dict item <\-> DFA terminal (category)...done +Reading in term file (optional)...done +42 categories, 99 words +DFA has 135 nodes and 198 arcs +\-\-\-\-\- +please input word sequence>silB 白 に して 下さい silE +wseq: silB 白 に して 下さい silE +cate: NS_B COLOR_N (NI|NI_AT) SURU_V KUDASAI_V NS_E +accepted +please input word sequence> +.fi +.RE +.sp +.SH "SEE ALSO" +.PP + +\fB mkdfa.pl \fR( 1 ) +, +\fB generate \fR( 1 ) +, +\fB nextword \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/adinrec.1 diff -u /dev/null julius4/man/ja/adinrec.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/adinrec.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,155 @@ +.\" Title: + adinrec + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "ADINREC" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + adinrec + \- 1発話の音声入力データをファイルに記録する +.SH "概要" +.HP 8 +\fBadinrec\fR [\fIoptions\fR...] {\fIfilename\fR} +.SH "DESCRIPTION" +.PP +adinrec は,音声区間を一定時間内の零交差数とパワー(振幅レベル)のしき い値に基づいて切り出し,ファイルに記録する.デフォルトでは標準デバイス を用いてマイク入力から録音するが,\fB\-input\fR +オプションで デバイスを選択可能である.またプラグイン入力も選択できる. +.PP +サンプリング周波数は任意に設定可能である.録音形式は 16bit, 1 channel であり,書き出されるファイル形式は Microsoft WAV 形式である. 既に同じ名前のファイルが存在する場合は上書きされる. +.PP +ファイル名に "\-" を指定すると取り込んだ音声データを標準出力へ出 力する.この場合データ形式は RAW 形式になる. +.SH "OPTIONS" +.PP +Julius の全てのオプションが指定可能である.指定されたもののうち, 音声入力に関係するオプションのみ扱われる.以下に,adinrec 独自の オプションと関係する Julius オプションに分けて解説する. +.SS "adinrec specific options" +.PP +\fB \-freq \fR \fIHz\fR +.RS 3n +音声のサンプリング周波数 (Hz) を指定する.(default: 16,000) +.RE +.PP +\fB \-raw \fR +.RS 3n +RAWファイル形式で出力する. +.RE +.SS "Concerning Julius options" +.PP +\fB \-input \fR {mic|rawfile|adinnet|stdin|netaudio|esd|alsa|oss} +.RS 3n +音声入力ソースを選択する.音声波形ファイルの場合は +fileあるいはrawfileを指 定する.起動後にプロンプトが表れるので,それに対してファイ ル名を入力する.adinnet +では, +adintool +などのクライアントプロセスから音声 データをネットワーク経由で受け取ることができる. +netaudio +はDatLinkのサーバから, +stdinは標準入力から音声入力を行う. +esdは,音声デバイスの共有手段として多くの Linuxのデスクトップ環境で利用されている EsounD daemon から入力する. +.RE +.PP +\fB \-lv \fR \fIthres\fR +.RS 3n +振幅レベルのしきい値.値は 0 から 32767 の範囲で指定する. (default: 2000) +.RE +.PP +\fB \-zc \fR \fIthres\fR +.RS 3n +零交差数のしきい値.値は1秒あたりの交差数で指定する. (default: 60) +.RE +.PP +\fB \-headmargin \fR \fImsec\fR +.RS 3n +音声区間開始部のマージン.単位はミリ秒. (default: 300) +.RE +.PP +\fB \-tailmargin \fR \fImsec\fR +.RS 3n +音声区間終了部のマージン.単位はミリ秒. (default: 400) +.RE +.PP +\fB \-zmean \fR +.RS 3n +入力音声ストリームに対して直流成分除去を行う.全ての音声処理の の前段として処理される. +.RE +.PP +\fB \-smpFreq \fR \fIHz\fR +.RS 3n +音声のサンプリング周波数 (Hz) を指定する.(default: 16,000) +.RE +.PP +\fB \-48 \fR +.RS 3n +48kHzで入力を行い,16kHzにダウンサンプリングする. これは 16kHz のモデルを使用しているときのみ有効である. ダウンダンプリングの内部機能は +sptk +から 移植された. (Rev. 4.0) +.RE +.PP +\fB \-NA \fR \fIdevicename\fR +.RS 3n +DatLink サーバのデバイス名 (\fB\-input netaudio\fR). +.RE +.PP +\fB \-adport \fR \fIport_number\fR +.RS 3n + +\fB\-input adinnet\fR +使用時,接続を受け付ける adinnet のボート番号を指定する.(default: 5530) +.RE +.PP +\fB \-nostrip \fR +.RS 3n +音声取り込み時,デバイスやファイルによっては,音声波形中に振幅 が "0" となるフレームが存在することがある.Julius は通常,音声 入力に含まれるそのようなフレームを除去する.この零サンプル除去が うまく動かない場合,このオプションを指定することで自動消去を 無効化することができる. +.RE +.PP +\fB \-C \fR \fIjconffile\fR +.RS 3n +jconf設定ファイルを読み込む.ファイルの内容がこの場所に展開される. +.RE +.PP +\fB \-plugindir \fR \fIdirlist\fR +.RS 3n +プラグインを読み込むディレクトリを指定する.複数の場合は コロンで区切って並べて指定する. +.RE +.SH "ENVIRONMENT VARIABLES" +.PP +\fB \fR\fB\fBALSADEV\fR\fR\fB \fR +.RS 3n +(マイク入力で alsa デバイス使用時) 録音デバイス名を指定する. 指定がない場合は "default". +.RE +.PP +\fB \fR\fB\fBAUDIODEV\fR\fR\fB \fR +.RS 3n +(マイク入力で oss デバイス使用時) 録音デバイス名を指定する. 指定がない場合は "\fI/dev/dsp\fR". +.RE +.PP +\fB \fR\fB\fBLATENCY_MSEC\fR\fR\fB \fR +.RS 3n +Linux (alsa/oss) および Windows で,マイク入力時の遅延時間をミ リ秒単位で指定する.短い値を設定することで入力遅延を小さくでき るが,CPU の負荷が大きくなり,また環境によってはプロセスやOSの 挙動が不安定になることがある.最適な値はOS やデバイスに大きく 依存する.デフォルト値は動作環境に依存する. +.RE +.SH "SEE ALSO" +.PP + +\fB julius \fR( 1 ) +, +\fB adintool \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/adintool.1 diff -u /dev/null julius4/man/ja/adintool.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/adintool.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,228 @@ +.\" Title: + adintool + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "ADINTOOL" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + adintool + \- 音声波形データの記録・分割・送信・受信ツール +.SH "概要" +.HP 9 +\fBadintool\fR {\-in\ \fIinputdev\fR} {\-out\ \fIoutputdev\fR} [\fIoptions\fR...] +.SH "DESCRIPTION" +.PP +adintool は,音声波形データ中の音声区間の検出および記録を連続的に行 うツールです.入力音声に対して零交差数と振幅レベルに基づく音声区間検 出を逐次行い,音声区間部分を連続出力します. +.PP +adintool は adinrec の高機能版です.音声データの入力元として,マイク 入力・ 音声波形ファイル・標準入力・ネットワーク入力(adinnet サーバー モード)が選択できます.Julius の +\fB\-input\fR +オプションも 使用可能で,プラグイン入力も選択できます. +.PP +出力先として,音声波形ファイル・標準出力・ネットワーク出力(adinnet ク ライアントモード)が選択できます.特にネットワーク出力(adinnet クライ アントモード)では, julius へネットワーク経由で音声を送信して音声認識 させることができます. +.PP +入力音声は音声区間ごとに自動分割され,逐次出力されます.音声区間の切 り出しには adinrec と同じ,一定時間内の零交差数とパワー(振幅レベル) のしきい値を用います.音声区間開始と同時に音声出力が開始されます.出 力としてファイル出力を選んだ場合は,連番ファイル名で検出された区間ごと に保存します. +.PP +サンプリング周波数は任意に設定可能です.録音形式は 16bit, 1 channel で,書き出されるファイル形式は Microsoft WAV 形式です. 既に同じ名前のファイルが存在する場合は上書きされます. +.SH "OPTIONS" +.PP +Julius の全てのオプションが指定可能である.指定されたもののうち, 音声入力に関係するオプションのみ扱われる.以下に,adintool の オプション,および有効な Julius オプションを解説する. +.SS "adintool specific options" +.PP +\fB \-freq \fR \fIHz\fR +.RS 3n +音声のサンプリング周波数 (Hz) を指定する.(default: 16,000) +.RE +.PP +\fB \-in \fR \fIinputdev\fR +.RS 3n +音声を読み込む入力デバイスを指定する."mic" でマイク入力, "file" でファイル入力, "stdin" で標準入力から音声を読み込む. ファイル入力の場合,ファイル名は起動後に出てくるプロンプトに対 して指定する.また,"adinnet" で adintool は adinnet サーバー となり,adinnet クライアントから音声データを tcp/ip 経由で 受け取る.ポート番号は 5530 である("\fB\-inport\fR" で変更可能). +.sp +入力デバイスは,そのほか Julius の "\-input" オプションでも指定可能 である.その場合,プラグインからの入力も可能である. +.RE +.PP +\fB \-out \fR \fIoutputdev\fR +.RS 3n +音声を出力するデバイスを指定する."file" でファイル出力, stdout で標準出力へ出力する.ファイルの場合,出力ファイル名は オプション "\fB\-filename\fR" で与える.出力ファイル 形式は 16bit WAV 形式である. また,"adinnet" で adintool は adinnet クライアント となり,adinnet サーバへ取り込んだ音声データを tcp/ip 経由で 送信できる.送信先ホストは "\fB\-server\fR" で指定する. ポート番号は 5530 である("\fB\-port\fR" で変更可能). +.RE +.PP +\fB \-inport \fR \fInum\fR +.RS 3n +入力が adinnet の場合 (\-in adinnet),接続を受けるポート番号 を指定する.指定しない場合のデフォルトは 5530 である. +.RE +.PP +\fB \-server \fR [host] [,host...] +.RS 3n +出力が adinnet の場合 (\-out adinnet),送信先のサーバ名を指定する. 複数ある場合は,カンマで区切って指定する. +.RE +.PP +\fB \-port \fR [num] [,num...] +.RS 3n +出力が adinnet の場合 (\-out adinnet),送信先の各サーバのポート番号 を指定する.指定しない場合のデフォルトは 5530 である. +\fB\-server\fR +で複数のサーバを指定している場合, 全てについて明示的にポート番号を指定する必要がある. +.RE +.PP +\fB \-filename \fR \fIfile\fR +.RS 3n +ファイル出力 (\fB\-out file\fR) 時,出力ファイル名を 与える.デフォルトでは,検出された音声区間検出ごとに, "\fIfile.0000.wav\fR" , "\fIfile.0001.wav\fR" ... のように区間ごとに連番で 記録される.番号の初期値は 0 である(\fB\-startid\fRで 変更可能).なお,オプション +\fB\-oneshot\fR +指定時は 最初の区間だけが "\fIfile\fR" の名前で保存される. +.RE +.PP +\fB \-startid \fR \fInumber\fR +.RS 3n +ファイル出力時,記録を開始する連番番号の初期値を指定する.( デフォルト:0) +.RE +.PP +\fB \-oneshot \fR +.RS 3n +最初の音声区間が終了したら終了する. +.RE +.PP +\fB \-nosegment \fR +.RS 3n +入力音声の音声区間検出(無音による区切りと無音区間のスキップ)を 行わない. +.RE +.PP +\fB \-raw \fR +.RS 3n +RAWファイル形式で出力する. +.RE +.PP +\fB \-autopause \fR +.RS 3n +出力が adinnet の場合(\-out adinnet),音声区間が終了するたび に入力停止・動作停止状態に移行する.出力先の adinnet サーバか ら動作再開信号がくると音声入力を再開する. +.RE +.PP +\fB \-loosesync \fR +.RS 3n +出力が adinnet (\-out adinnet)で複数の出力先サーバへ出力している 場合,動作停止状態から動作再開信号によって動作を再開する際,adintool は すべてのサーバから動作再開信号を受けるまで動作を再開しない. このオプションを指定すると,少なくとも1つのサーバから再開信号 がくれば動作を再開するようになる. +.RE +.PP +\fB \-rewind \fR \fImsec\fR +.RS 3n +入力がマイクのとき,停止状態から動作を再開するとき,停止中から 持続して音声入力中だった場合,指定されたミリ秒分だけさかのぼって 録音を開始する. +.RE +.SS "Concerning Julius options" +.PP +\fB \-input \fR {mic|rawfile|adinnet|stdin|netaudio|esd|alsa|oss} +.RS 3n +音声入力ソースを選択する."\-in" の代わりにこちらを使うことも できる(最後に指定したほうが優先される).esd やプラグイン入力が 指定可能である. +.RE +.PP +\fB \-lv \fR \fIthres\fR +.RS 3n +振幅レベルのしきい値.値は 0 から 32767 の範囲で指定する. (default: 2000) +.RE +.PP +\fB \-zc \fR \fIthres\fR +.RS 3n +零交差数のしきい値.値は1秒あたりの交差数で指定する. (default: 60) +.RE +.PP +\fB \-headmargin \fR \fImsec\fR +.RS 3n +音声区間開始部のマージン.単位はミリ秒. (default: 300) +.RE +.PP +\fB \-tailmargin \fR \fImsec\fR +.RS 3n +音声区間終了部のマージン.単位はミリ秒. (default: 400) +.RE +.PP +\fB \-zmean \fR +.RS 3n +入力音声ストリームに対して直流成分除去を行う.全ての音声処理の の前段として処理される. +.RE +.PP +\fB \-smpFreq \fR \fIHz\fR +.RS 3n +音声のサンプリング周波数 (Hz) を指定する.(default: 16,000) +.RE +.PP +\fB \-48 \fR +.RS 3n +48kHzで入力を行い,16kHzにダウンサンプリングする. これは 16kHz のモデルを使用しているときのみ有効である. ダウンダンプリングの内部機能は +sptk +から 移植された. (Rev. 4.0) +.RE +.PP +\fB \-NA \fR \fIdevicename\fR +.RS 3n +DatLink サーバのデバイス名 (\fB\-input netaudio\fR). +.RE +.PP +\fB \-adport \fR \fIport_number\fR +.RS 3n + +\fB\-input adinnet\fR +使用時,接続を受け付ける adinnet のボート番号を指定する.(default: 5530) +.RE +.PP +\fB \-nostrip \fR +.RS 3n +音声取り込み時,デバイスやファイルによっては,音声波形中に振幅 が "0" となるフレームが存在することがある.Julius は通常,音声 入力に含まれるそのようなフレームを除去する.この零サンプル除去が うまく動かない場合,このオプションを指定することで自動消去を 無効化することができる. +.RE +.PP +\fB \-C \fR \fIjconffile\fR +.RS 3n +jconf設定ファイルを読み込む.ファイルの内容がこの場所に展開される. +.RE +.PP +\fB \-plugindir \fR \fIdirlist\fR +.RS 3n +プラグインを読み込むディレクトリを指定する.複数の場合は コロンで区切って並べて指定する. +.RE +.SH "ENVIRONMENT VARIABLES" +.PP +\fB \fR\fB\fBALSADEV\fR\fR\fB \fR +.RS 3n +(マイク入力で alsa デバイス使用時) 録音デバイス名を指定する. 指定がない場合は "default". +.RE +.PP +\fB \fR\fB\fBAUDIODEV\fR\fR\fB \fR +.RS 3n +(マイク入力で oss デバイス使用時) 録音デバイス名を指定する. 指定がない場合は "\fI/dev/dsp\fR". +.RE +.PP +\fB \fR\fB\fBLATENCY_MSEC\fR\fR\fB \fR +.RS 3n +Linux (alsa/oss) および Windows で,マイク入力時の遅延時間をミ リ秒単位で指定する.短い値を設定することで入力遅延を小さくでき るが,CPU の負荷が大きくなり,また環境によってはプロセスやOSの 挙動が不安定になることがある.最適な値はOS やデバイスに大きく 依存する.デフォルト値は動作環境に依存する. +.RE +.SH "EXAMPLES" +.PP +マイクからの音声入力を,発話ごとに "data.0000.wav" から順に記録する: +.sp .RS 3n .nf % \fBadintool\fR \-in mic \-out file \-filename data .fi .RE +巨大な収録音声ファイル "foobar.raw" を,音声区間ごとに "foobar.1500.wav" "foobar.1501.wav" ... に分割する: +.sp .RS 3n .nf % \fBadintool\fR \-in file \-out file \-filename foobar \-startid 1500 % enter filename\->foobar.raw .fi .RE +ネットワーク経由で音声ファイルを転送する(区間検出なし): +.sp .RS 3n .nf (sender) % \fBadintool\fR \-in file \-out adinnet \-server \fIreceiver_hostname\fR \-nosegment (receiver) % \fBadintool\fR \-in adinnet \-out file \-nosegment .fi .RE +マイクからの入力音声を Julius へ送信して認識: +.sp .RS 3n .nf (sender) % \fBadintool\fR \-in mic \-out adinnet \-server \fIreceiver_hostname\fR (receiver) % \fBjulius\fR \-C ... \-input adinnet .fi .RE +.SH "SEE ALSO" +.PP + +\fB julius \fR( 1 ) +, +\fB adinrec \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/dfa_determinize.1 diff -u /dev/null julius4/man/ja/dfa_determinize.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/dfa_determinize.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,65 @@ +.\" Title: + dfa_determinize + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "DFA_DETERMINIZE" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + dfa_determinize + \- 有限オートマトン文法を決定化する +.SH "概要" +.HP 16 +\fBdfa_determinize\fR [\-o\ \fIoutfile\fR] {dfafile} +.SH "DESCRIPTION" +.PP +dfa_determinize は,.dfa ファイルを等価な決定性 .dfa ファイルに変換し, 標準出力に出力します.オプション +\fB\-o\fR +で出力先を 指定することもできます. +.PP + +\fBmkdfa.pl\fR +が生成するDFAは常に決定化されており, 通常,\fBmkdfa.pl\fR +で作成された .dfa ファイルに対して このツールを使う必要はありません. +.SH "OPTIONS" +.PP +\fB \-o \fR \fIoutfile\fR +.RS 3n +出力ファイル名を指定する. +.RE +.SH "EXAMPLES" +.PP + +\fIfoo.dfa\fR +を決定化して +\fIbar.dfa\fR +に 保存する. +.sp .RS 3n .nf % \fBdfa_determinize\fR \-o bar.dfa foo.dfa .fi .RE +別の方法: +.sp .RS 3n .nf % \fBdfa_determinize\fR < foo.dfa > bar.dfa .fi .RE +.SH "SEE ALSO" +.PP + +\fB mkdfa.pl \fR( 1 ) +, +\fB dfa_minimize \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/dfa_minimize.1 diff -u /dev/null julius4/man/ja/dfa_minimize.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/dfa_minimize.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,64 @@ +.\" Title: + dfa_minimize + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "DFA_MINIMIZE" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + dfa_minimize + \- 有限オートマトン文法を最小化する +.SH "概要" +.HP 13 +\fBdfa_minimize\fR [\-o\ \fIoutfile\fR] {dfafile} +.SH "DESCRIPTION" +.PP +dfa_minimize は,.dfa ファイルを等価な最小化の .dfa ファイルに変換し, 標準出力に出力します.オプション +\fB\-o\fR +で出力先を 指定することもできます. +.PP +バージョン 3.5.3 以降の Julius に付属の +\fBmkdfa.pl\fR +は, このツールを内部で自動的に呼び出すので,出力される .dfa は常に最小化 されており,これを単体で実行する必要はありません.バージョン 3.5.2 以前の +\fBmkdfa.pl\fR +で出力された .dfa は最小化されていないので, このツールで最小化するとサイズを最適化することができます. +.SH "OPTIONS" +.PP +\fB \-o \fR \fIoutfile\fR +.RS 3n +出力ファイル名を指定する. +.RE +.SH "EXAMPLES" +.PP + +\fIfoo.dfa\fR +を最小化して +\fIbar.dfa\fR +に 保存する. +.sp .RS 3n .nf % \fBdfa_minimize\fR \-o bar.dfa foo.dfa .fi .RE +別の方法: +.sp .RS 3n .nf % \fBdfa_minimize\fR < foo.dfa > bar.dfa .fi .RE +.SH "SEE ALSO" +.PP + +\fB mkdfa.pl \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/generate-ngram.1 diff -u /dev/null julius4/man/ja/generate-ngram.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/generate-ngram.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,79 @@ +.\" Title: + generate\-ngram + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "GENERATE\-NGRAM" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + generate\-ngram + \- N\-gram に従って文をランダム生成する +.SH "概要" +.HP 15 +\fBgenerate\-ngram\fR [\fIoptions\fR...] {\fIbinary_ngram\fR} +.SH "DESCRIPTION" +.PP +generate\-ngram は,与えられた N\-gram 確率に従って文をランダム生成する ツールです.\fIbinary_ngram\fR +には, バイナリ形式の N\-gram ファイルを指定します. +.SH "OPTIONS" +.PP +\fB \-n \fR \fInum\fR +.RS 3n +生成する文数を指定する(デフォルト:10) +.RE +.PP +\fB \-N \fR +.RS 3n +使用する N\-gram の長さを制限する(デフォルト:与えられたモデルで定義されている最大値,3\-gram なら 3). +.RE +.PP +\fB \-bos \fR +.RS 3n +文開始記号を指定する(デフォルト:<s>) +.RE +.PP +\fB \-eos \fR +.RS 3n +文終了記号を指定する(デフォルト:</s>) +.RE +.PP +\fB \-ignore \fR +.RS 3n +出力してほしくない単語を指定する(デフォルト:<UNK>) +.RE +.PP +\fB \-v \fR +.RS 3n +冗長な出力を行う. +.RE +.PP +\fB \-debug \fR +.RS 3n +デバッグ用出力を行う. +.RE +.SH "SEE ALSO" +.PP + +\fB julius \fR( 1 ) +, +\fB mkbingram \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/generate.1 diff -u /dev/null julius4/man/ja/generate.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/generate.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,94 @@ +.\" Title: + generate + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "GENERATE" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + generate + \- 文法から文をランダム生成する +.SH "概要" +.HP 9 +\fBgenerate\fR [\-v] [\-t] [\-n\ \fInum\fR] [\-s\ \fIspname\fR] {prefix} +.SH "DESCRIPTION" +.PP +generate は文法に従って文をランダムに生成します. +.PP +実行には .dfa, .dict, .term の各ファイルが必要です. あらかじめ +\fBmkdfa.pl\fR +で生成しておいて下さい. +.SH "OPTIONS" +.PP +\fB \-t \fR +.RS 3n +単語ではなくカテゴリ名で出力する. +.RE +.PP +\fB \-n \fR \fInum\fR +.RS 3n +生成する文の数を指定する (default: 10) +.RE +.PP +\fB \-s \fR \fIspname\fR +.RS 3n +生成においてスキップすべきショートポーズ単語の名前を指定する. (default: "sp") +.RE +.PP +\fB \-v \fR +.RS 3n +デバッグ出力. +.RE +.SH "EXAMPLES" +.PP +vfr (フィッティングタスク用文法) での実行例: +.sp +.RS 3n +.nf +% generate vfr +Reading in dictionary...done +Reading in DFA grammar...done +Mapping dict item <\-> DFA terminal (category)...done +Reading in term file (optional)...done +42 categories, 99 words +DFA has 135 nodes and 198 arcs + \-\-\-\-\- +silB やめます silE +silB 終了します silE +silB シャツ を スーツ と 統一して 下さい silE +silB スーツ を カッター と 同じ 色 に 統一して 下さい silE +silB 交換して 下さい silE +silB これ を 覚えておいて 下さい silE +silB 覚えておいて 下さい silE +silB 戻って 下さい silE +silB スーツ を シャツ と 統一して 下さい silE +silB 上着 を 橙 に して 下さい silE +.fi +.RE +.sp +.SH "SEE ALSO" +.PP + +\fB mkdfa.pl \fR( 1 ) +, +\fB generate\-ngram \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/gram2sapixml.pl.1 diff -u /dev/null julius4/man/ja/gram2sapixml.pl.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/gram2sapixml.pl.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,55 @@ +.\" Title: + gram2sapixml.pl + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "GRAM2SAPIXML.PL" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + gram2sapixml.pl + \- 認識用文法を SAPI XML 文法に変換するスクリプト +.SH "概要" +.HP 16 +\fBgram2sapixml.pl\fR [\fIprefix\fR...] +.SH "DESCRIPTION" +.PP +gram2sapixml.pl は,Julius の認識用文法ファイル (.grammar, .voca) から Microsoft SAPI XML 形式へ変換するスクリプトです. +\fIprefix\fR +には,変換する .grammar, .voca ファ イルのファイル名から拡張子を除外したものを指定します.複数指定した場合, それらは逐次変換されます. +.PP +入力文字コードは EUC\-JPを想定しています.出力ファイルは UTF\-8 エンコー ディングです.コード変換のため内部で +\fBiconv\fR +を使用 しています. +.PP +左再帰性については手作業による修正が必要です.元ファイルの .grammar の 構造をそのまま保持するため,.grammar における正順での左再帰記述がその まま .xml に反映されます.したがって,変換後 .xml に含まれる左再帰性の 解決は手作業で行わなければいけません. +.SH "SEE ALSO" +.PP + +\fB mkdfa.pl \fR( 1 ) +.SH "DIAGNOSTICS" +.PP +変換は,元ファイルの文法の非終端記号と終端記号(単語カテゴリ名)をルール に変換するという単純なものです.実際にSAPIアプリケーションで使う場合に は,プロパティを指定するなど,手作業での修正が必要です. +.PP +内部でコード変換に +\fBiconv\fR +を使用しています. 実行パス上に iconv が無い場合,エラーとなります. +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/jclient.pl.1 diff -u /dev/null julius4/man/ja/jclient.pl.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/jclient.pl.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,44 @@ +.\" Title: + jclient.pl + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "JCLIENT.PL" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + jclient.pl + \- perl 版サンプルクライアント +.SH "概要" +.HP 11 +\fBjclient.pl\fR +.SH "DESCRIPTION" +.PP +Julius に付属のサンプルクライアント "jcontrol" の Perl 版です. モジュール(サーバ)モードで動く Julius から認識結果を受け取ったり, Julius を制御したりできます. +.PP +わずか 57 行の簡単なプログラムです.アプリケーションへ Julius を組み込 む際の参考になれば幸いです.ご自由にご利用ください。 +.SH "EXAMPLES" +.PP .RS 3n .nf % \fBjulius\fR \-C ... \-module .fi .RE +上記のようにして Julius をモジュールモードで起動した後,jclient.pl を 起動します.接続するホストのデフォルトは localhost, ポート番号は 10500 です.変えたい場合はスクリプトの冒頭を書き換えてください. +.sp .RS 3n .nf % \fBjclient.pl\fR .fi .RE +音声入力を行えば,イベント内容や結果が jclient.pl 側に送信され, 標準出力に出力されます.また,jclient.pl に対してコマンドを入力する (最後に Enter を押す)と,Julius にコマンドが送信され,Julius が制御されます. コマンドは,仕様書にあるモジュールコマンドを生のまま記述します. +.SH "SEE ALSO" +.PP + +\fB julius \fR( 1 ) +, +\fB jcontrol \fR( 1 ) +.SH "COPYRIGHT" +.PP +jclient.pl は 西村竜一 さん (nisim****@sys*****\-u.ac.jp) によって作 成されました.本プログラムのご利用に関しては,作者は一切の保証をしませ ん.各自の責任のもとでご利用ください. +.PP +感想、御意見、御要望などのフィードバックは歓迎いたしますので, 上記メールアドレス,または下記ホームページへ御連絡ください. +.PP +http://w3voice.jp/ Index: julius4/man/ja/jcontrol.1 diff -u /dev/null julius4/man/ja/jcontrol.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/jcontrol.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,193 @@ +.\" Title: + jcontrol + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "JCONTROL" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + jcontrol + \- Juliusモジュールモード用のサンプルクライアント +.SH "概要" +.HP 9 +\fBjcontrol\fR {\fIhostname\fR} [\fIportnum\fR] +.SH "DESCRIPTION" +.PP +jcontrol は,モジュールモードで動作している julius に接続し,APIを介し てコントロールする簡単なコンソールプログラムです.Julius への一時停止 や再開などのコマンドの送信,および Julius からの認識結果や音声イベントの メッセージ受信を行うことができます. +.PP +起動後,jcontrol は,指定ホスト上において「モジュールモード」で動作中 のJulius に対し,接続を試みます.接続確立後,jcontrol はユーザーからの コマンド入力およびメッセージ受信待ち状態となります. +.PP +jcontrol は ユーザーが入力したコマンドを解釈し,対応するAPIコマンドを Julius へ送信します.また,Julius から認識結果や入力トリガ情報 など のメッセージが送信されてきたときは,その内容を標準出力へ書き出します. +.PP +モジュールモードの仕様については,関連文書をご覧下さい. +.SH "OPTIONS" +.PP +\fB hostname \fR +.RS 3n +接続先のホスト名 +.RE +.PP +\fB portnum \fR +.RS 3n +ポート番号(デフォルト:10500) +.RE +.SH "COMMANDS" +.PP +jcontrol は標準入力から1行ずつコマンド文字列を受け取る. コマンドの一覧は以下の通り. +.SS "動作制御" +.PP +pause +.RS 3n +Juliusの認識動作を中断させ,一時停止状態に移行させる.一時停止状 態にあるJuliusは,たとえ音声入力があっても認識処理を行わない. ある区間の音声認識処理の途中でこのコマンドを受け取った場合, Julius はその認識処理が終了した後,一時停止状態に移行する. +.RE +.PP +terminate +.RS 3n + +pauseと同じく,Juliusの認識動作を中断させ, 一時停止状態に移行させる.ある区間の音声認識処理の途中でこのコ マンドを受け取った場合,その入力を破棄して即座に一時停止状態に 移行する. +.RE +.PP +resume +.RS 3n +Julius を一時停止状態から通常状態へ移行させ,認識を再開させる. +.RE +.PP +inputparam \fIarg\fR +.RS 3n +文法切り替え時に音声入力であった場合の入力中音声の扱いを指定. "TERMINATE", "PAUSE", "WAIT"のうちいずれかを指定. +.RE +.PP +version +.RS 3n +Julius にバージョン文字列を返させる. +.RE +.PP +status +.RS 3n +Julius からシステムの状態 (active / sleep) を報告させる. +.RE +.SS "文法・単語認識関連" +.PP +changegram \fIprefix\fR +.RS 3n +認識文法を "\fIprefix.dfa\fR" と "\fIprefix.dict\fR" に切り替える.カレントプロ セス内の文法は全て消去され,指定された文法に置き換わる. +.RE +.PP +addgram \fIprefix\fR +.RS 3n +認識文法として "\fIprefix.dfa\fR" と "\fIprefix.dict\fR" をカレントプロセスに追加する. +.RE +.PP +deletegram \fIgramlist\fR +.RS 3n +カレントプロセスから指定された文法を削除する.文法の指定は,文 法名(追加時の +\fIprefix\fR)か,あるいは Julius から送られる +GRAMINFO内にある文法 ID で指定する.複数の文法を削除したい場合は,文法名もしくはIDをカ ンマで区切って複数指定する(IDと文法名が混在してもよい). +.RE +.PP +deactivategram \fIgramlist\fR +.RS 3n +カレントプロセスの指定された文法を一時的に無効にする.無効にされた 文法は,エンジン内に保持されたまま,認識処理からは一時的に除外される. 無効化された文法は +activategram +で再び有効化できる. +.sp +文法の指定は,文法名(追加時の +\fIprefix\fR)か,あるいはJulius から送ら れる +GRAMINFO内にある文法 ID で指定する.複 数の文法を指定したい場合は,文法名もしくはIDをカンマで区切って 複数指定する(IDと文法名が混在してもよい). +.RE +.PP +activategram \fIgramlist\fR +.RS 3n +カレントプロセスで無効化されている文法を有効化する. 文法の指定は,文法名(追加時の +\fIprefix\fR)か,あるいはJulius から送ら れる +GRAMINFO内にある文法 ID で指定する.複 数の文法を指定したい場合は,文法名もしくはIDをカンマで区切って 複数指定する(IDと文法名が混在してもよい). +.RE +.PP +addword \fIgrammar_name_or_id\fR \fIdictfile\fR +.RS 3n +dictfile の中身を,カレントプロセスの指定された文法に追加する. +.RE +.PP +syncgram +.RS 3n +addgram や deletegram などによる文法の更新を即時に行う. 同期確認用である. +.RE +.SS "プロセス関連のコマンド" +.PP +Julius\-4 では複数モデルの同時認識が行える.この場合, 認識プロセス ("\fB\-SR\fR" で指定された認識処理インスタンス) ごとにモジュールクライアントから操作を行うことができる. +.PP +クライアントからはどれか一つのプロセスが「カレントプロセス」として 割り当てられる.文法関連の命令はカレントプロセスに対して行われる. +.PP +listprocess +.RS 3n +Julius に現在エンジンにある認識プロセスの一覧を送信させる. +.RE +.PP +currentprocess \fIprocname\fR +.RS 3n +カレントプロセスを指定された名前のプロセスに切り替える. +.RE +.PP +shiftprocess +.RS 3n +カレントプロセスを循環切り替えする.呼ばれるたびにその次のプロセスに カレントプロセスが切り替わる. +.RE +.PP +addprocess \fIjconffile\fR +.RS 3n +エンジンに認識プロセスを新たに追加する.与える +\fIjconffile\fR +は,通常のものと違い, ただ一種類の LM 設定を含むものである必要がある.また,実際に送られる のはパス名のみであり,ファイル読み込みはJulius側で行われるため, ファイルパスは Julius から見える場所を指定する必要が有る. +.sp +追加された LM および認識プロセスは,jconffile の名前が プロセス名となる. +.RE +.PP +delprocess \fIprocname\fR +.RS 3n +指定された名前の認識プロセスをエンジンから削除する. +.RE +.PP +deactivateprocess \fIprocname\fR +.RS 3n +指定された名前の認識プロセスを,一時的に無効化する.無効化され たプロセスは次回以降の入力に対して認識処理からスキップされる. 無効化されたプロセスは +activateprocess +で 再び有効化できる. +.RE +.PP +activateprocess \fIprocname\fR +.RS 3n +指定された名前の認識プロセスを有効化する. +.RE +.SH "EXAMPLES" +.PP +Julius からのメッセージは "> " を行の先頭につけてそのまま標準出力に出力 されます.以下は実行例です. +.sp .RS 3n .nf % \fBjulius\fR \-C ... \-module .fi .RE +上記のようにして Julius をモジュールモードで起動した後, jcontrol をそのホスト名を指定して起動します. +.sp .RS 3n .nf % \fBjcontrol\fR hostname .fi .RE +音声入力を行えば,イベント内容や結果が jcontrol 側に送信されます. jcontrol に対してコマンドを入力する(最後に Enter を押す)と, Julius にコマンドが送信され,Julius が制御されます. +.PP +詳しいプロトコルについては,関連文書を参照してください. +.SH "SEE ALSO" +.PP + +\fB julius \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/julius.1 diff -u /dev/null julius4/man/ja/julius.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/julius.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,1324 @@ +.\" Title: + julius + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "JULIUS" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + julius + \- 大語彙連続音声認識エンジン +.SH "概要" +.HP 7 +\fBjulius\fR [\-C\ \fIjconffile\fR] [\fIoptions\fR...] +.SH "内容" +.PP +Julius は数万語を対象とした大語彙連続音声認識を行うことのできるフリー の認識エンジンです.単語N\-gramを用いた2パス構成の段階的探索により高精 度な認識を行うことができます.また,小規模語彙のための文法ベースの認識 や単単語認識も行うことができます.認識対象としてマイク入力,録音済みの 音声波形ファイル,特徴抽出したパラメータファイルなどに対応しています. +.PP +コアの認識処理は,全て JuliusLib ライブラリとして提供されています. JuliusはJuliusLibを用いる音声アプリケーションの一つです. +.PP +Julius を用いて音声認識を行うには,音響モデル,単語辞書,および言語モ デルが必要です. +.SH "設定" +.PP +Julius および JuliusLib コアエンジンの設定(動作選択,設定,モデル指定, パラメータ変更など)は,すべてここで説明する「オプション」で指定する. Julius に対しては,これらのオプションをコマンドライン引数として直接指 定するか,あるいはテキストファイル内に記述したものを "\fB\-C\fR" につづけて指定する.このオプションを記述したテキストファイルは "jconf 設定ファイル" と呼ばれる. +.PP +JuliusLib を用いる他のアプリケーションにおいても,JuliusLib内の認識 エンジンへの動作指定は,同様にこのオプション群で行う.jconf 設定ファイル に設定内容を記述して,それをメイン関数の最初で +\fBj_config_load_file_new(char *jconffile);\fR +で呼び出 すことで,JuliusLib 内の認識エンジンに設定をセットすることができる. +.PP +なお,jconf 設定ファイル内では,相対ファイルパスはその jconf ファイル の位置からの相対パスとして解釈される(カレントディレクトリではない). 注意されたい. +.PP +以下に各オプションを解説する. +.SS "Julius アプリケーションオプション" +.PP +.PP +JuliusLib とは独立した,アプリケーションとしての Julius の機能に関する オプションである.認識結果の出力,文字コード変換,ログの設定,モジュー ルモードなどを含む.これらのオプションは,JuliusLib を組み込んだ他のア プリケーションでは使用できないので注意すること. +.PP +\fB \-outfile \fR +.RS 3n +認識結果を個別のファイルに出力する.入力ファイルごとの認識結果を, その拡張子を ".out" に変えたファイルに保存する. (rev. 4.0) +.RE +.PP +\fB \-separatescore \fR +.RS 3n +認識結果で言語スコアと音響スコアを個別に出力する.指定しない場 合,和の値が認識結果のスコアとして出力される. +.RE +.PP +\fB \-callbackdebug \fR +.RS 3n +コールバックがJuliusLibから呼ばれたときにコールバック名を 標準出力に出力する.デバッグ用である.(rev.4.0) +.RE +.PP +\fB \-charconv \fR \fIfrom\fR \fIto\fR +.RS 3n +出力で文字コードの変換を行う.\fIfrom\fR +は言語モデルの文字セットを,\fIto\fR +は出 力の文字セットを指定する.文字セットは,Linux では +iconv +で用いられるコード名である.Windows では,コードページ番号あるいはいかに示すコード名のどれかである: +ansi, +mac, +oem, +utf\-7, +utf\-8, +sjis, +euc. +.RE +.PP +\fB \-nocharconv \fR +.RS 3n +文字コード変換を行わない.\fB\-charconv\fR +の指定を リセットする. +.RE +.PP +\fB \-module \fR [port] +.RS 3n +Julius を「サーバモジュールモード」で起動する.TCP/IP 経由でク ライアンとやりとりし,処理の制御や認識結果・イベントの通知が行 える.port +はポート番号であり,省略時は 10500 が用いられる. +.RE +.PP +\fB \-record \fR \fIdir\fR +.RS 3n +区間検出された入力音声をファイルに逐次保存する. +\fIdir\fRは保存するディレクトリを指定する. ファイル名は,それぞれの処理終了時のシステム時間から +YYYY.MMDD.HHMMSS.wavの形で保存される.ファ イル形式は16bit, 1チャンネルのWAV形式である. なお,入力がGMM等によって棄却された場合も記録される. +.RE +.PP +\fB \-logfile \fR \fIfile\fR +.RS 3n +通常 Julius は全てのログ出力を標準出力に出力する. このオプションを指定することで,それらの出力を指定ファイルに 切替えることができる.(Rev.4.0) +.RE +.PP +\fB \-nolog \fR +.RS 3n +ログ出力を禁止する.標準出力には何も出力されなくなる. (Rev.4.0) +.RE +.PP +\fB \-help \fR +.RS 3n +エンジン設定,オプション一覧などのヘルプを出力して終了する. +.RE +.SS "全体オプション" +.PP +全体オプションは,モデルや探索以外のオプションであり, 音声入力・音検出・GMM・プラグイン・その他の設定を含む. 全体オプションは, 音響モデル(\fB\-AM\fR)・言語モデル(\fB\-LM\fR)・デ コーダ(\fB\-SR\fR)などのセクション定義の前に定義するか, +\fB\-GLOBAL\fR +のあとに指定する. +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fBオーディオ入力\fR +.RS +.PP +\fB \-input \fR {mic|rawfile|mfcfile|adinnet|stdin|netaudio|esd|alsa|oss} +.RS 3n +音声入力ソースを選択する.音声波形ファイルの場合は +fileあるいはrawfileを指 定する.HTK +形式の特徴量ファイルを認識する場合は +htkparamあるいはmfcfile +を指定する.起動後にプロンプトが表れるので,それに対してファイ ル名を入力する.adinnet +では, +adintool +などのクライアントプロセスから音声 データをネットワーク経由で受け取ることができる. +netaudio +はDatLinkのサーバから, +stdinは標準入力からの音声入力を認識する. +esdは,音声デバイスの共有手段として多くの Linuxのデスクトップ環境で利用されている EsounD daemon からの入 力を認識する. +.RE +.PP +\fB \-filelist \fR \fIfilename\fR +.RS 3n +(\fB\-input rawfile|mfcfile\fR +時) +\fIfilename\fR内に列挙されている全てのファ イルについて認識を順次行う. +\fIfilename\fRには認識する入力ファイル名 を1行に1つずつ記述する. +.RE +.PP +\fB \-notypecheck \fR +.RS 3n +入力の特徴量ベクトルの型チェックを無効にする.通常 Julius は入 力の型が音響モデルとマッチするかどうかをチェックし,マッチしない とエラー終了する.このオプションはそのチェックを回避する.なんらかの 理由で型チェックがうまく動作しないときに使用する. +.RE +.PP +\fB \-48 \fR +.RS 3n +48kHzで入力を行い,16kHzにダウンサンプリングしながら認識する. これは 16kHz のモデルを使用しているときのみ有効である. ダウンダンプリングの内部機能は +sptk +から 移植された. (Rev. 4.0) +.RE +.PP +\fB \-NA \fR \fIdevicename\fR +.RS 3n +DatLink サーバのデバイス名 (\fB\-input netaudio\fR). +.RE +.PP +\fB \-adport \fR \fIport_number\fR +.RS 3n + +\fB\-input adinnet\fR +使用時,接続を受け付ける adinnet のボート番号を指定する.(default: 5530) +.RE +.PP +\fB \-nostrip \fR +.RS 3n +音声取り込み時,デバイスやファイルによっては,音声波形中に振幅 が "0" となるフレームが存在することがある.Julius は通常,音声 入力に含まれるそのようなフレームを除去する.この零サンプル除去が うまく動かない場合,このオプションを指定することで自動消去を 無効化することができる. +.RE +.PP +\fB \-zmean \fR, \fB \-nozmean \fR +.RS 3n +入力音声ストリームに対して直流成分除去を行う.全ての音声処理の の前段として処理される. +\fB\-zmeansource\fRオプションも見よ. +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fBレベルと零交差による入力検知\fR +.RS +.PP +\fB \-cutsilence \fR, \fB \-nocutsilence \fR +.RS 3n +レベルと零交差による入力検知を行うかどうかを指定する.デフォル トは,リアルタイム認識(デバイス直接入力およびネットワーク入力) では on, ファイル入力では off である.このオプションを指定する ことで,例えば長時間録音された音声ファイルに対して音声区間検出 を行いながら認識を行うこともできる. +.RE +.PP +\fB \-lv \fR \fIthres\fR +.RS 3n +振幅レベルのしきい値.値は 0 から 32767 の範囲で指定する. (default: 2000) +.RE +.PP +\fB \-zc \fR \fIthres\fR +.RS 3n +零交差数のしきい値.値は1秒あたりの交差数で指定する. (default: 60) +.RE +.PP +\fB \-headmargin \fR \fImsec\fR +.RS 3n +音声区間開始部のマージン.単位はミリ秒. (default: 300) +.RE +.PP +\fB \-tailmargin \fR \fImsec\fR +.RS 3n +音声区間終了部のマージン.単位はミリ秒. (default: 400) +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fB入力棄却\fR +.RS +.PP +入力長,あるいは平均パワーによる入力の事後棄却が行える. 平均パワーによる棄却は,デフォルトでは無効化されており,ソースからコンパイ ルする際に +configureに +\-\-enable\-power\-reject +を指定することで有効となる. リアルタイム認識時で,かつ特徴量でパワー項を持つ場合のみ使用できる. +.PP +\fB \-rejectshort \fR \fImsec\fR +.RS 3n +検出された区間長が\fImsec\fR以下の入力を 棄却する.その区間の認識は中断・破棄される. +.RE +.PP +\fB \-powerthres \fR \fIthres\fR +.RS 3n +切り出し区間の平均パワーのしきい値.(Rev.4.0) +.sp +このオプションはコンパイル時に +\-\-enable\-power\-rejectが指定されたときに 有効となる. +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fBGMM / GMM\-VAD\fR +.RS +.PP +\fB \-gmm \fR \fIhmmdefs_file\fR +.RS 3n +GMM定義ファイル.3状態(出力状態が1つのみ)のHMMとして定義す る.形式はHTK形式で与える.形式や使用できる特徴量の制限は音響 モデルと同じである. なお,GMMで用いるMFCC特徴量の設定は, +\fB\-AM_GMM\fRのあとに音響モデルと同様に指定する.こ の特徴量設定は音響モデルと別に,明示的に指定する必要があること に注意が必要である. +.RE +.PP +\fB \-gmmnum \fR \fInumber\fR +.RS 3n +GMM指定時,計算するガウス分布数を指定する.フレームごとにGMMの 出力確率を求める際,各モデルで定義されている混合ガウス分布のう ち,この\fInumber\fRで指定した数の上位ガ ウス分布の確率のみを計算する.小さな値を指定するほどGMMの計算 量を削減できるが,計算精度が悪くなる.(default: 10) +.RE +.PP +\fB \-gmmreject \fR \fIstring\fR +.RS 3n +GMMで定義されているモデル名のうち,非音声として棄却すべきモデ ルの名称を指定する.モデル名を複数指定することができる.複数指 定する場合は,空白を入れずコンマで区切って一つの +\fIstring\fRとして指定する. +.RE +.PP +\fB \-gmmmargin \fR \fIframes\fR +.RS 3n +(GMM_VAD) GMM VAD による区間検出の開始部マージン.単位はフレー ム数で指定する.(default: 20) (Rev. 4.0) +.sp +このオプションは\-\-enable\-gmm\-vad付きでコンパイル されたときに有効となる. +.RE +.PP +\fB \-gmmup \fR \fIvalue\fR +.RS 3n +(GMM_VAD) 音声区間の開始とみなす VAD スコアの閾値.VADスコアは (音声GMMの最大尤度 \- 非音声HMMの最大尤度) で表される. (Default: 0.7) (Rev.4.1) +.sp +このオプションは\-\-enable\-gmm\-vad付きでコンパイル されたときに有効となる. +.RE +.PP +\fB \-gmmdown \fR \fIvalue\fR +.RS 3n +(GMM_VAD) 音声区間の終了とみなす VAD スコアの閾値.VADスコアは (音声GMMの最大尤度 \- 非音声HMMの最大尤度) で表される. (Default: \-0.2) (Rev.4.1) +.sp +このオプションは\-\-enable\-gmm\-vad付きでコンパイル されたときに有効となる. +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fBデコーディングオプション\fR +.RS +.PP +デコーディングオプションは,使用する認識アルゴリズムに関する設定を行う オプションである.この設定はエンジン全体に対する設定であり,全ての認識 処理インスタンスで共通の設定となる.探索の幅や言語重みなどの個々のデコー ディング設定については,認識処理インスタンスごとに指定する. +.PP +\fB \-realtime \fR, \fB \-norealtime \fR +.RS 3n +入力と並行してリアルタイム認識を行うかどうかを明示的に指定する. デフォルトの設定は入力デバイスに依存し,マイクロフォン等のデバ イス直接認識,ネットワーク入力,および DatLink/NetAudio 入力の 場合は ON, ファイル入力や特徴量入力についてはOFFとなっている. +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fBその他\fR +.RS +.PP +\fB \-C \fR \fIjconffile\fR +.RS 3n +jconf設定ファイルを読み込む.ファイルの内容がこの場所に展開される. +.RE +.PP +\fB \-version \fR +.RS 3n +バージョン情報を標準エラー出力に出力して終了する. +.RE +.PP +\fB \-setting \fR +.RS 3n +エンジン設定情報を標準エラー出力に出力して終了する. +.RE +.PP +\fB \-quiet \fR +.RS 3n +出力を抑制する.認識結果は単語列のみが出力される. +.RE +.PP +\fB \-debug \fR +.RS 3n +(デバッグ用) モデルの詳細や探索過程の記録など,様々な デバッグ情報をログに出力する. +.RE +.PP +\fB \-check \fR {wchmm|trellis|triphone} +.RS 3n +デバッグ用のチェックモードに入る. +.RE +.PP +\fB \-plugindir \fR \fIdirlist\fR +.RS 3n +プラグインを読み込むディレクトリを指定する.複数の場合は コロンで区切って並べて指定する. +.RE +.RE +.SS "複数モデル認識のためのインスタンス宣言" +.PP +\fB \-AM \fR \fIname\fR +.RS 3n +音響モデルインスタンスを新たに宣言する.以降の音響モデルに関す る設定はこのインスタンスに対するものと解釈される. +\fIname\fR +にはインスタンスにつける名前を 指定する(既にある音響モデルインスタンスと同じ名前であってはい けない). (Rev.4.0) +.RE +.PP +\fB \-LM \fR \fIname\fR +.RS 3n +言語モデルインスタンスを新たに宣言する.以降の言語モデルに関す る設定はこのインスタンスに対するものと解釈される. +\fIname\fR +にはインスタンスにつける名前を 指定する(既にある言語モデルインスタンスと同じ名前であってはい けない). (Rev.4.0) +.RE +.PP +\fB \-SR \fR \fIname\fR \fIam_name\fR \fIlm_name\fR +.RS 3n +認識処理インスタンスを新たに宣言する.以降の認識処理や探索に関 する設定はこのインスタンスに対するものと解釈される. +\fIname\fR +にはインスタンスにつける名前を 指定する(既にある認識処理インスタンスと同じ名前であってはいけ ない).\fIam_name\fR, +\fIlm_name\fR +にはそれぞれこのインスタン スが使用する音響モデルと言語モデルのインスタンスを名前,あるい は ID 番号で指定する.(Rev.4.0) +.RE +.PP +\fB \-AM_GMM \fR +.RS 3n +GMM使用時に,GMM計算のための特徴量抽出パラメータを,この宣言の あとに指定する.もし GMM 使用時にこのオプションでGMM用の特徴量 パラメータを指定しなかった場合,最後に指定した音響モデル用の特 徴量がそのまま用いられる. (Rev.4.0) +.RE +.PP +\fB \-GLOBAL \fR +.RS 3n +全体オプション用のセクションを開始する.\fB\-AM\fR, +\fB\-LM\fR, +\fB\-SR\fR +などのインスタンス 宣言を用いる場合,音声入力設定などの全体オプションは,これらの 全てのインスタンス定義よりも前か,あるいはこのオプションの あとに指定する必要がある.この全体オプション用のセクションは, jconf 内で何回現れても良い. (Rev.4.1) +.RE +.PP +\fB \-nosectioncheck \fR, \fB \-sectioncheck \fR +.RS 3n +複数インスタンスを用いる jconf において,オプションの位置チェッ クの有効・無効を指定する.有効である場合,ある種類のインスタン スの宣言がされたあとは,他のインスタンス宣言が現れるまで,その インスタンスのオプションしか指定できない(例: +\fB\-AM\fR +のあと,他の +\fB\-AM\fRや +\fB\-LM\fRなどが現れるまで,音響モデルオプションしか 指定できない.他のオプションがあらわれた場合はエラーとなる). また,全体オプションは全てのモデルインスタンスの前に指定する必 要がある.デフォルトでは有効になっている.(Rev.4.1) +.RE +.SS "言語モデル (\fB\-LM\fR)" +.PP +このグループには,各モデルタイプごとに指定するオプションが含まれている. 一つのインスタンスには一つのモデルタイプだけが指定可能である. +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fBN\-gram\fR +.RS +.PP +\fB \-d \fR \fIbingram_file\fR +.RS 3n +使用するN\-gramをバイナリファイル形式で指定する. バイナリ形式への変換は +mkbingram +を 使用する. +.RE +.PP +\fB \-nlr \fR \fIarpa_ngram_file\fR +.RS 3n +前向き (left\-to\-right) のN\-gram 言語モデルを指定する. +\fIarpa_ngram_file\fR +はARPA標準形式のファ イルである必要がある. +.RE +.PP +\fB \-nrl \fR \fIarpa_ngram_file\fR +.RS 3n +後ろ向き (right\-to\-left) のN\-gram 言語モデルを指定する. +\fIarpa_ngram_file\fR +はARPA標準形式のファ イルである必要がある. +.RE +.PP +\fB \-v \fR \fIdict_file\fR +.RS 3n +N\-gram,または文法用の単語辞書ファイルを指定する. +.RE +.PP +\fB \-silhead \fR \fIword_string\fR \fB \-siltail \fR \fIword_string\fR +.RS 3n +音声入力両端の無音区間に相当する「無音単語」エントリを指定する. 単語の読み(N\-gramエントリ名),あるいは"#"+単語番号(辞書ファ イルの行番号\-1)で指定する.デフォルトはそれぞれ "<s>", "</s>" である. +.RE +.PP +\fB \-iwspword \fR +.RS 3n +ポーズに対応する無音単語を辞書に追加する.追加される単語の内容は オプション\fB\-iwspentry\fRで変更できる. +.RE +.PP +\fB \-iwspentry \fR \fIword_entry_string\fR +.RS 3n + +\fB\-iwspword\fR指定時に追加される単語エントリの内容 を指定する.辞書エントリと同じ形式で指定する.(default: "<UNK> [sp] sp sp") +.RE +.PP +\fB \-sepnum \fR \fInumber\fR +.RS 3n +木構造化辞書の構築時に線形登録する単語数を指定する.(default: 150) +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fB文法\fR +.RS +.PP + +\fB\-gram\fRや\fB\-gramlist\fRで文法を複数回指定す ることで,一つのインスタンス内で複数の文法を用いることができる. (旧Juliusのオプション +\fB\-dfa\fR, +\fB\-v\fR +の 組合せは単一の文法のみ指定可能である) +.PP +\fB \-gram \fR gramprefix1[,gramprefix2[,gramprefix3,...]] +.RS 3n +認識に使用する文法を指定する.文法はファイル(辞書および構文制約 有限オートマトン)のプレフィックスで指定する.すなわち,ある認 識用文法が\fIdir/foo.dict\fRと +\fIdir/foo.dfa\fR +としてあるとき, +dir/fooのように拡張子を省いた名前で指定する. 文法はコンマで区切って複数指定することができる.また繰り返し 使用することでも複数指定できる. +.RE +.PP +\fB \-gramlist \fR \fIlist_file\fR +.RS 3n +認識に使用する文法のリストをファイルで指定する. +\fIlist_file\fRには, +\fB\-gram\fR +と同様の文法プレフィックスを1行に1つず つ記述する.また,このオプションを繰り返し使用することで,複数 のリストファイルを指定できる.なお,リスト内で文法を相対パスで 指定した場合,それは,そのリストファイルからの相対パスとして解 釈されることに注意が必要である. +.RE +.PP +\fB \-dfa \fR \fIdfa_file\fR \fB \-v \fR \fIdict_file\fR +.RS 3n +認識に使用する文法の構文制約オートマトンと辞書をそれぞれ指定する. (Julius\-3.x との互換性のための古いオプションであり,使用すべきでない) +.RE +.PP +\fB \-nogram \fR +.RS 3n +それまでに +\fB\-gram\fR,\fB\-gramlist\fR, +\fB\-dfa\fR +および +\fB\-v\fR +で 指定された文法のリストをクリアし,文法の指定なしの状態 にする. +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fB単単語\fR +.RS +.PP +\fB \-w \fR \fIdict_file\fR +.RS 3n +単単語認識で用いる単語辞書を指定する.ファイル形式は単語N\-gram や文法と同一である.辞書上の全ての単語が認識対象となる. (Rev.4.0) +.RE +.PP +\fB \-wlist \fR \fIlist_file\fR +.RS 3n +単語辞書のリストを指定する.\fIlist_file\fR +には1行に一つずつ,使用する単語辞書のパスを記述する.相対パスを 用いた場合,それはその\fIlist_file\fRから の相対パスとして解釈される. (Rev.4.0) +.RE +.PP +\fB \-nogram \fR +.RS 3n +それまでに +\fB\-w\fR +あるいは +\fB\-wlist\fRで 指定された辞書のリストをクリアし,指定なしの状態に戻す. +.RE +.PP +\fB \-wsil \fR \fIhead_sil_model_name\fR \fItail_sil_model_name\fR \fIsil_context_name\fR +.RS 3n +単単語認識時,音声入力の両端の無音モデルおよびそのコンテキスト 名を指定する. +\fIsil_context_name\fRとして +NULLを指定した場合,各モデル名がそのまま コンテキストとして用いられる. +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fBUser\-defined LM\fR +.RS +.PP +\fB \-userlm \fR +.RS 3n +プログラム中のユーザ定義言語スコア計算関数を使用することを宣言 する.(Rev.4.0) +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fBその他の言語モデル関連\fR +.RS +.PP +\fB \-forcedict \fR +.RS 3n +単語辞書読み込み時のエラーを無視する.通常Juliusは単語辞書内に エラーがあった場合そこで動作を停止するが,このオプションを 指定することで,エラーの生じる単語をスキップして処理を続行する ことができる. +.RE +.RE +.SS "音響モデル・特徴量抽出 (\fB\-AM\fR) (\fB\-AM_GMM\fR)" +.PP +音響モデルオプションは,音響モデルおよび特徴量抽出・フロントエンド処理 に関する設定を行う.特徴量抽出,正規化処理,スペクトルサブトラクションの 指定もここで行う. +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fB音響HMM関連\fR +.RS +.PP +\fB \-h \fR \fIhmmdef_file\fR +.RS 3n +使用するHMM定義ファイル. +HTK +の ASCII 形 式ファイル,あるいはJulius バイナリ形式のファイルのどちらかを 指定する.バイナリ形式へは +mkbinhmm +で 変換できる. +.RE +.PP +\fB \-hlist \fR \fIhmmlist_file\fR +.RS 3n +HMMlistファイルを指定する.テキスト形式,あるいはバイナリ形式 のどちらかを指定する.バイナリ形式へは +mkbinhmmlist +で変換できる. +.RE +.PP +\fB \-tmix \fR \fInumber\fR +.RS 3n +Gaussianpruning の計算状態数を指定する.小さ いほど計算が速くなるが,音響尤度の誤差が大きくなる.See also +\fB\-gprune\fR. (default: 2) +.RE +.PP +\fB \-spmodel \fR \fIname\fR +.RS 3n +文中のショートポーズに対応する音韻HMMの名前を指定する.このポーズ モデル名は,\fB\-iwsp\fR, +\fB\-spsegment\fR, +\fB\-pausemodels\fRに関係する.また,文法使用時に スキップ可能なポーズ単語エントリの識別にも用いられる. (default: "sp") +.RE +.PP +\fB \-multipath \fR \fB \-nomultipath \fR +.RS 3n +状態間遷移を拡張するマルチパスモードを有効にする.オプション指 定がない場合,Julius は音響モデルの遷移をチェックし,必要であ れば自動的にマルチパスモードを有効にする.このオプションは,ユー ザが明示的にモードを指定したい場合に使用する. +.sp +この機能は 3.x ではコンパイル時オプションであったが,4.0 より 実行時オプションとなった.(rev.4.0) +.RE +.PP +\fB \-gprune \fR {safe|heuristic|beam|none|default} +.RS 3n +使用する Gaussian pruning アルゴリズムを選択する. +noneを指定すると Gaussian pruning を無効化 しすべてのガウス分布について厳密に計算する. +safe +は上位 N 個を計算する. +heuristic +と +beam +はsafe に比べてより積極的な枝刈りを行うため計算量削減の効果が大きいが, 認識精度の低下を招く可能性がある.defaultが 指定された場合,デフォルトの手法を使う.(default: tied\-mixture model の場合,standard 設定ではsafe,fast設 定ではbeam.tied\-mixture でない場合 +none). +.RE +.PP +\fB \-iwcd1 \fR {max|avg|best number} +.RS 3n +第1パスの単語間トライフォン計算法を指定する. +max +指定時,同じコンテキストのトライフォン集合の 全尤度の最大値を近似尤度として用いる.avg +は 全尤度の平均値を用いる.best number +は上位 N 個の トライフォンの平均値を用いる. デフォルトは,一緒に使用される言語モデルに依存する.N\-gram使用 時には +best 3,文法使用時は +avgとなる.もしこの音響モデルが異なるタイプの 複数の言語モデルで共有される場合は,後に定義されたほうのデフォルトが デフォルト値として用いられる. +.RE +.PP +\fB \-iwsppenalty \fR \fIfloat\fR +.RS 3n + +\fB\-iwsp\fRによって末尾に付加される単語末ショートポー ズの挿入ペナルティ.ここで指定した値が,通常単語の末尾から単語 末ショートポーズへの遷移に追加される. +.RE +.PP +\fB \-gshmm \fR \fIhmmdef_file\fR +.RS 3n +Gaussian Mixture Selection 用のモノフォン音響モデルを指定する. GMS用モノフォンは通常のモノフォンから +mkgshmm +によって生成できる. +.RE +.PP +\fB \-gsnum \fR \fInumber\fR +.RS 3n +GMS 使用時,対応するトライフォンを詳細計算するモノフォンの 状態の数を指定する. (default: 24) +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fB特徴量抽出パラメータ\fR +.RS +.PP +\fB \-smpPeriod \fR \fIperiod\fR +.RS 3n +音声のサンプリング周期を指定する.単位は,100ナノ秒の単位で指 定する.サンプリング周期は +\fB\-smpFreq\fR +でも指定 可能.(default: 625) +.sp +このオプションは +HTK +の +SOURCERATE +に対応する.同じ値が指定できる. +.sp +複数の音響モデルを用いる場合,全インスタンスで共通の値を指定する必要 がある. +.RE +.PP +\fB \-smpFreq \fR \fIHz\fR +.RS 3n +音声のサンプリング周波数 (Hz) を指定する.(default: 16,000) +.sp +複数の音響モデルを用いる場合,全インスタンスで共通の値を指定する必要 がある. +.RE +.PP +\fB \-fsize \fR \fIsample_num\fR +.RS 3n +窓サイズをサンプル数で指定 (default: 400). +.sp +このオプションは +HTK +の +WINDOWSIZE +に対応する.ただし値はHTKと異なり,(HTKの値 / smpPeriod) となる. +.sp +複数の音響モデルを用いる場合,全インスタンスで共通の値を指定する必要 がある. +.RE +.PP +\fB \-fshift \fR \fIsample_num\fR +.RS 3n +フレームシフト幅をサンプル数で指定 (default: 160). +.sp +このオプションは +HTK +の +TARGETRATE +に対応する.ただし値はHTKと異なり,(HTKの値 / smpPeriod) となる. +.sp +複数の音響モデルを用いる場合,全インスタンスで共通の値を指定する必要 がある. +.RE +.PP +\fB \-preemph \fR \fIfloat\fR +.RS 3n +プリエンファシス係数 (default: 0.97) +.sp +このオプションは +HTK +の +PREEMCOEF +に対応する.同じ値が指定できる. +.RE +.PP +\fB \-fbank \fR \fInum\fR +.RS 3n +フィルタバンクチャンネル数.(default: 24) +.sp +このオプションは +HTK +の +NUMCHANS +に対応する.同じ値が指定できる.指定しないときのデフォルト値が +HTKと異なっていることに注意(HTKでは22). +.RE +.PP +\fB \-ceplif \fR \fInum\fR +.RS 3n +ケプストラムのリフタリング係数. (default: 22) +.sp +このオプションは +HTK +の +CEPLIFTER +に対応する.同じ値が指定できる. +.RE +.PP +\fB \-rawe \fR, \fB \-norawe \fR +.RS 3n +エネルギー項の値として,プリエンファシス前の raw energy を使用 する / しない (default: disabled=使用しない) +.sp +このオプションは +HTK +の +RAWENERGY +に対応する. 指定しないときのデフォルトがHTKと異なっていることに注意(HTKで はenabled). +.RE +.PP +\fB \-enormal \fR, \fB \-noenormal \fR +.RS 3n +エネルギー項の値として,発話全体の平均で正規化した正規化エネルギー を用いるかどうかを指定する.(default: \-noenormal) +.sp +このオプションは +HTK +の +ENORMALISE +に対応する. 指定しないときのデフォルトがHTKと異なっていることに注意(HTKで はenabled). +.RE +.PP +\fB \-escale \fR \fIfloat_scale\fR +.RS 3n +エネルギー正規化時の,対数エネルギー項のスケーリング係数. (default: 1.0) +.sp +このオプションは +HTK +の +ESCALE +に対応する.デフォルト値がHTKと異なっていることに注意(HTKでは 0.1). +.RE +.PP +\fB \-silfloor \fR \fIfloat\fR +.RS 3n +エネルギー正規化時の,無音部のエネルギーのフロアリング値. (default: 50.0) +.sp +このオプションは +HTK +の +SILFLOOR +に対応する.同じ値が指定できる. +.RE +.PP +\fB \-delwin \fR \fIframe\fR +.RS 3n +一次差分計算用のウィンドウフレーム幅.(default: 2) +.sp +このオプションは +HTK +の +DELTAWINDOW +に対応する.同じ値が指定できる. +.RE +.PP +\fB \-accwin \fR \fIframe\fR +.RS 3n +二次差分計算用のウィンドウフレーム幅.(default: 2) +.sp +このオプションは +HTK +の +ACCWINDOW +に対応する.同じ値が指定できる. +.RE +.PP +\fB \-hifreq \fR \fIHz\fR +.RS 3n +MFCCのフィルタバンク計算時におけるバンド制限を有効化する.この オプションではカットオフ周波数の上限値を指定する. \-1 を指定することで無効化できる.(default: \-1) +.sp +このオプションは +HTK +の +HIFREQ +に対応する.同じ値が指定できる. +.RE +.PP +\fB \-lofreq \fR \fIHz\fR +.RS 3n +MFCCのフィルタバンク計算時におけるバンド制限を有効化する.この オプションではカットオフ周波数の下限値を指定する. \-1 を指定することで無効化できる.(default: \-1) +.sp +このオプションは +HTK +の +LOFREQ +に対応する.同じ値が指定できる. +.RE +.PP +\fB \-zmeanframe \fR, \fB \-nozmeanframe \fR +.RS 3n +窓単位の直流成分除去を有効化/無効化する. (default: disabled) +.sp +このオプションは +HTK +の +ZMEANSOURCE +に対応する.\fB\-zmean\fR +も参照のこと. +.RE +.PP +\fB \-usepower \fR +.RS 3n +フィルタバンク解析で振幅の代わりにパワーを使う.(default: disabled) +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fB正規化処理\fR +.RS +.PP +\fB \-cvn \fR +.RS 3n +ケプストラム分散正規化 (cepstral variance normalization; CVN) を有効にする.ファイル入力では,入力全体の分散に基づいて正規化 が行われる.直接入力ではあらかじめ分散が得られないため,最後の 入力の分散で代用される.音声信号入力でのみ有効である. +.RE +.PP +\fB \-vtln \fR \fIalpha\fR \fIlowcut\fR \fIhicut\fR +.RS 3n +周波数ワーピングを行う.声道長正規化 (vocal tract length normalization; VTLN) に使用できる.引数はそれぞれワーピング 係数,周波数上端,周波数下端であり,HTK設定の +WARPFREQ,WARPHCUTOFF +および +WARPLCUTOFF +に対応する. +.RE +.PP +\fB \-cmnload \fR \fIfile\fR +.RS 3n +起動時にケプストラム平均ベクトルを +\fIfile\fRから読み込む.ファイルは +\fB\-cmnsave\fR +で保存されたファイルを指定する.これ は MAP\-CMN において,起動後最初の発話においてケプストラム平均 の初期値として用いられる.通常,2発話目以降は初期値は,直前の 入力の平均に更新されるが,\fB\-cmnnoupdate\fRを指定 された場合,常にこのファイルの値が各発話の初期値として用いられ る. +.RE +.PP +\fB \-cmnsave \fR \fIfile\fR +.RS 3n +認識中に計算したケプストラム平均ベクトルを +\fIfile\fRへ保存する.すでにファイルがあ る場合は上書きされる.この保存は音声入力が行われるたびに上書きで 行われる. +.RE +.PP +\fB \-cmnupdate \fR \fB \-cmnnoupdate \fR +.RS 3n +実時間認識時,初期ケプストラム平均を入力ごとに更新するかどうか を指定する.通常は有効 (\fB\-cmnupdate\fR) であり, 過去5秒間の入力の平均を初期値として更新する. +\fB\-cmnnoupdate\fR +が指定された場合,更新は行われず, 初期値は起動時の値に固定される.\fB\-cmnload\fR +で初期値 を指定することで,常に同じ初期値を使うようにすることができる. +.RE +.PP +\fB \-cmnmapweight \fR \fIfloat\fR +.RS 3n +MAP\-CMN の初期ケプストラム平均への重みを指定する.値が大きいほ ど初期値に長時間依存し,小さいほど早く現入力のケプストラム平均 を用いるようになる.(default: 100.0) +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fBフロントエンド処理\fR +.RS +.PP +\fB \-sscalc \fR +.RS 3n +入力先頭の無音部を用いて,入力全体に対してスペクトルサブトラク ションを行う.先頭部の長さは\fB\-sscalclen\fRで指定する. ファイル入力に対してのみ有効である.\fB\-ssload\fR +と 同時に指定できない. +.RE +.PP +\fB \-sscalclen \fR \fImsec\fR +.RS 3n + +\fB\-sscalc\fRオプション指定時,各ファイルにおいて ノイズスペクトルの推定に用いる長さをミリ秒で指定する.(default: 300) +.RE +.PP +\fB \-ssload \fR \fIfile\fR +.RS 3n +ノイズスペクトルを\fIfile\fRから読み込ん でスペクトルサブトラクションを行う. +\fIfile\fRはあらかじめ +mkssで作成する.マイク入力・ネットワーク入 力などのオンライン入力でも適用できる.\fB\-sscalc\fRと 同時に指定できない. +.RE +.PP +\fB \-ssalpha \fR \fIfloat\fR +.RS 3n + +\fB\-sscalc\fRおよび\fB\-ssload\fR用の 減算係数を指定する.この値が大きいほど強くスペクトル減算を行うが, 減算後の信号の歪も大きくなる.(default: 2.0) +.RE +.PP +\fB \-ssfloor \fR \fIfloat\fR +.RS 3n +スペクトルサブトラクションのフロアリング係数を指定する.スペク トル減算時,計算の結果パワースペクトルが負となってしまう帯域に 対しては,原信号にこの係数を乗じたスペクトルが割り当てられる. (default: 0.5) +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fBその他の音響モデル関連オプション\fR +.RS +.PP +\fB \-htkconf \fR \fIfile\fR +.RS 3n + +HTK +Config ファイルを解析して,対応する特徴量抽出オプションを Julius に自動設定する.\fIfile\fR +は +HTK +で音響モデル学習時に使用した Config ファイルを指定する.なお, Julius と +HTK +ではパラメータのデフォルト値が一部異なるが, このオプションを使用する場合,デフォルト値も +HTK +のデフォルト に切替えれられる. +.RE +.RE +.SS "認識処理・探索 (\fB\-SR\fR)" +.PP +認識処理・探索オプションは,第1パス・第2パス用のビーム幅や言語重みのパラメータ,ショートポーズセグメンテーションの設定,単語ラティス・CN 出力用設定,forced alignment の指定,その他の認識処理と結果出力に関するパラメータを含む. +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fB第1パスパラメータ\fR +.RS +.PP +\fB \-lmp \fR \fIweight\fR \fIpenalty\fR +.RS 3n +(N\-gram使用時) 第1パス用の言語スコア重みおよび挿入ペナルティ. ペナルティは負であれば単語挿入を抑制し,正であれば単語挿入を促 進する. +.RE +.PP +\fB \-penalty1 \fR \fIpenalty\fR +.RS 3n +(文法使用時) 第1パス用の単語挿入ペナルティ. (default: 0.0) +.RE +.PP +\fB \-b \fR \fIwidth\fR +.RS 3n +第1パス探索の枝刈り (rank pruning) のビーム幅を指定する.単位 は HMM ノード数である. デフォルト値は音響モデルやエンジンの設定による.モノフォン 使用時は400, トライフォン使用時は800,トライフォンでかつ setup=v2.1 のときは 1000 となる. +.RE +.PP +\fB \-nlimit \fR \fInum\fR +.RS 3n +第1パスでノードごとに保持する仮説トークンの最大数.通常は 1 で 固定されており変更できない.コンパイル時に +configureで +\-\-enable\-wpairおよび +\-\-enable\-wpair\-nlimit +が指定されているとき のみ変更できる. +.RE +.PP +\fB \-progout \fR +.RS 3n +第1パスで,一定時間おきにその時点での最尤仮説系列を出力する. +.RE +.PP +\fB \-proginterval \fR \fImsec\fR +.RS 3n + +\fB\-progout\fRの出力インターバルをミリ秒で指定する. (default: 300) +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fB第2パスパラメータ\fR +.RS +.PP +\fB \-lmp2 \fR \fIweight\fR \fIpenalty\fR +.RS 3n +(N\-gram使用時) 第2パス用の言語スコア重みおよび挿入ペナルティ. ペナルティは負であれば単語挿入を抑制し,正であれば単語挿入を促 進する. +.RE +.PP +\fB \-penalty2 \fR \fIpenalty\fR +.RS 3n +(文法使用時) 第2パス用の単語挿入ペナルティ. (default: 0.0) +.RE +.PP +\fB \-b2 \fR \fIwidth\fR +.RS 3n +第2パス探索における仮説展開回数の上限を指定する.単位は 仮説数.(default: 30) +.RE +.PP +\fB \-sb \fR \fIfloat\fR +.RS 3n +第2パスの仮説尤度計算時のスコア幅を指定する.単位は対数尤度差 である.(default: 80.0) +.RE +.PP +\fB \-s \fR \fInum\fR +.RS 3n +仮説のスタックサイズを指定する.(default: 500) +.RE +.PP +\fB \-n \fR \fInum\fR +.RS 3n + +\fInum\fR個の文仮説数が見付かるまで探索を 行う.得られた仮説はスコアでソートされて出力される (\fB\-output\fRも見よ).デフォルト値はコンパイル時 のエンジン設定によって変わり,fast 版では 1, standard版では10 である. +.RE +.PP +\fB \-output \fR \fInum\fR +.RS 3n +見つかったN\-best候補のうち,結果として出力する文仮説の数を 指定する.\fB\-n\fRも参照のこと.(default: 1) +.RE +.PP +\fB \-m \fR \fIcount\fR +.RS 3n +探索打ち切りのための仮説展開回数のしきい値を指定する. (default: 2000) +.RE +.PP +\fB \-lookuprange \fR \fIframe\fR +.RS 3n +第2パスの単語展開時に,接続しうる次単語候補を見付けるための 終端時刻の許容幅をフレーム数で指定する.値を大きくするほど その周辺の多くの仮説を次単語候補として仮説展開が行われるように なるが,探索が前に進みにくくなることがある.(default: 5) +.RE +.PP +\fB \-looktrellis \fR +.RS 3n +仮説展開を第1パスの結果単語トレリス上に絞る. +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fBショートポーズセグメンテーション\fR +.RS +.PP +\fB \-spsegment \fR +.RS 3n +ショートポーズセグメンテーションを有効にする. (Rev.4.0) +.RE +.PP +\fB \-spdur \fR \fIframe\fR +.RS 3n +無音区間判定のためのしきい値を指定する.無音単語が一位仮説とな るフレームがこの値以上続いたとき,無音区間として入力が区切られ る.(default: 10) +.RE +.PP +\fB \-pausemodels \fR \fIstring\fR +.RS 3n +「無音単語」を定義するための音響モデルにおける無音モデルの名前 を指定する.コンマで区切って複数の名前を指定できる. このオプションが指定されない場合,文法を用いた認識では +\fB\-spmodel\fR +で指定されるモデルのみを読みとする単 語が無音単語とされる.また,N\-gramではこれに加えて +\fB\-silhead\fR +および +\fB\-siltail\fR +で 指定される単語も無音単語として扱われる.(Rev.4.0) +.RE +.PP +\fB \-spmargin \fR \fIframe\fR +.RS 3n +デコーダベースVADにおいて,アップトリガ時の巻戻し幅をフレーム 数で指定する.(Rev.4.0) +.sp +このオプションはconfigureに +\-\-enable\-decoder\-vadを付けてコンパイルしたとき のみ有効である. +.RE +.PP +\fB \-spdelay \fR \fIframe\fR +.RS 3n +デコーダベースVADにおいて,アップトリガ判定の遅延幅をフレーム 数で指定する.(Rev.4.0) +.sp +このオプションはconfigureに +\-\-enable\-decoder\-vadを付けてコンパイルしたとき のみ有効である. +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fB単語ラティス / confusion network 出力\fR +.RS +.PP +\fB \-lattice \fR, \fB \-nolattice \fR +.RS 3n +単語グラフ(ラティス)の出力を有効化/無効化する. +.RE +.PP +\fB \-confnet \fR, \fB \-noconfnet \fR +.RS 3n +Confusion network の出力を有効化/無効化する.confusion network は単語グラフから生成されるため,有効時は同時に +\fB\-lattice\fR +も有効化される.(Rev.4.0) +.RE +.PP +\fB \-graphrange \fR \fIframe\fR +.RS 3n +グラフ生成において近傍の同一単語仮説をマージする.開始フレーム および終了フレームの位置の差がそれぞれ +\fIframe\fR以下の同一単語仮説についてマー ジする.その際,スコアは高いほうのものが残される.値が \-1 の場 合,マージは一切行われない.値を大きくするほどコンパクトなグラ フが生成されるが,スコアの誤差が大きくなる.このオプションは +\fB\-confnet\fRにも影響する.(default: 0) +.RE +.PP +\fB \-graphcut \fR \fIdepth\fR +.RS 3n +生成されたグラフに対して,深さによるカットオフを行う. +\fIdepth\fRは,あるフレームにおいて存在可 能な単語数の上限を指定する.Julius では,第2パスの探索が不安定 な場合,一部分が極端に深いグラフが生成されることが稀にあり,こ のオプションによってそれを抑制することができる.\-1 を指定する ことでこの機能は無効化される.(default: 80) +.RE +.PP +\fB \-graphboundloop \fR \fIcount\fR +.RS 3n +事後的に行われる単語グラフの境界時間調整において,振動による 無限ループを防ぐための打ち切り値を指定する.(default: 20) +.RE +.PP +\fB \-graphsearchdelay \fR, \fB \-nographsearchdelay \fR +.RS 3n +巨大グラフ生成用にアルゴリズムをチューニングする.このオプショ ンが有効時,Julius は第1文仮説が見つかる前のグラフ生成時の仮説 中断を行わないように,グラフ生成アルゴリズムを変更する.これは, ビーム幅や探索範囲を極端に大きくして巨大なワードグラフを生成し ようとするときに,グラフの精度を改善することがある.(default: disabled) +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fB複数文法/複数辞書認識\fR +.RS +.PP +文法や単単語認識において,一つのインスタンスで複数の文法や辞書を用いる 場合に指定できるオプションである. +.PP +\fB \-multigramout \fR, \fB \-nomultigramout \fR +.RS 3n +複数文法あるいは複数辞書を用いて認識を行う場合,通常の Julius は全ての文法/辞書の中から最尤仮説を出力する.このオプションを 指定することで,与えられた個々の文法/辞書ごとに一位仮説を 出力することができる.(default: disabled) +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fBForced alignment\fR +.RS +.PP +\fB \-walign \fR +.RS 3n +認識結果を用いて,入力に対する単語単位の forced alignment を行 う.単語の境界フレームと平均音響尤度が出力される. +.RE +.PP +\fB \-palign \fR +.RS 3n +認識結果を用いて,入力に対する音素単位の forced alignment を行 う.音素ごとの境界フレームと平均音響尤度が出力される. +.RE +.PP +\fB \-salign \fR +.RS 3n +認識結果を用いて,入力に対するHMMの状態単位の forced alignment を行う.状態ごとの境界フレームと平均音響尤度が出力される. +.RE +.RE +.sp +.it 1 an-trap +.nr an-no-space-flag 1 +.nr an-break-flag 1 +.br +\fBその他\fR +.RS +.PP +\fB \-inactive \fR +.RS 3n +認識処理インスタンスを一時停止状態 (inactive state) で起動する. (Rev.4.0) +.RE +.PP +\fB \-1pass \fR +.RS 3n +第1パスのみを実行する.このオプションを指定した場合,第2パスは 実行されない. +.RE +.PP +\fB \-fallback1pass \fR +.RS 3n +通常,第2パスの探索が失敗したとき,Julius は認識結果無しで終了 する.このオプションを指定することで,そのような第2パスの失敗時に, 第1パスの最尤仮説を最終結果として出力することができる. (これはJulius\-3.xでのデフォルトの振る舞いである) +.RE +.PP +\fB \-no_ccd \fR, \fB \-force_ccd \fR +.RS 3n +音響モデルを音素コンテキスト依存モデルとして扱うかどうかを明示 的に指定する.デフォルトはHMM中のモデル名から自動判断される. +.sp +.RE +.PP +\fB \-cmalpha \fR \fIfloat\fR +.RS 3n +確信度計算のためのスコアのスムージング係数.(default: 0.05) +.RE +.PP +\fB \-iwsp \fR +.RS 3n +(マルチパスモード時のみ有効)単語間にショートポーズモデルを 挟み込んだ認識処理を行う.このオプションを指定すると,辞書上の 全単語の末尾に,スキップ可能なショートポーズモデルが付加される. このショートポーズモデルはコンテキストを考慮せず,また前後の 音素のコンテキストにも表れない.付加するショートポーズモデルは +\fB\-spmodel\fR +で指定できる. +.RE +.PP +\fB \-transp \fR \fIfloat\fR +.RS 3n +透過単語に対する追加の挿入ペナルティを指定する.(default: 0.0) +.RE +.PP +\fB \-demo \fR +.RS 3n + +\fB\-progout \-quiet\fRと同等. +.RE +.RE +.SH "ENVIRONMENT VARIABLES" +.PP +\fB \fR\fB\fBALSADEV\fR\fR\fB \fR +.RS 3n +(マイク入力で alsa デバイス使用時) 録音デバイス名を指定する. 指定がない場合は "default". +.RE +.PP +\fB \fR\fB\fBAUDIODEV\fR\fR\fB \fR +.RS 3n +(マイク入力で oss デバイス使用時) 録音デバイス名を指定する. 指定がない場合は "\fI/dev/dsp\fR". +.RE +.PP +\fB \fR\fB\fBLATENCY_MSEC\fR\fR\fB \fR +.RS 3n +Linux (alsa/oss) および Windows で,マイク入力時の遅延時間をミ リ秒単位で指定する.短い値を設定することで入力遅延を小さくでき るが,CPU の負荷が大きくなり,また環境によってはプロセスやOSの 挙動が不安定になることがある.最適な値はOS やデバイスに大きく 依存する.デフォルト値は動作環境に依存する. +.RE +.SH "ENVIRONMENT VARIABLES" +.PP +\fB \fR\fB\fBALSADEV\fR\fR\fB \fR +.RS 3n +(マイク入力で alsa デバイス使用時) 録音デバイス名を指定する. 指定がない場合は "default". +.RE +.PP +\fB \fR\fB\fBAUDIODEV\fR\fR\fB \fR +.RS 3n +(マイク入力で oss デバイス使用時) 録音デバイス名を指定する. 指定がない場合は "\fI/dev/dsp\fR". +.RE +.PP +\fB \fR\fB\fBLATENCY_MSEC\fR\fR\fB \fR +.RS 3n +Linux (alsa/oss) および Windows で,マイク入力時の遅延時間をミ リ秒単位で指定する.短い値を設定することで入力遅延を小さくでき るが,CPU の負荷が大きくなり,また環境によってはプロセスやOSの 挙動が不安定になることがある.最適な値はOS やデバイスに大きく 依存する.デフォルト値は動作環境に依存する. +.RE +.SH "EXAMPLES" +.PP +使用例については付属のチュートリアルをご覧下さい. +.SH "SEE ALSO" +.PP +\fBjulian\fR(1), +\fBjcontrol\fR(1), +\fBadinrec\fR(1), +\fBadintool\fR(1), +\fBmkbingram\fR(1), +\fBmkbinhmm\fR(1), +\fBmkgsmm\fR(1), wav2\fBmfcc\fR(1), +\fBmkss\fR(1) +.PP +[1]\&\fIhttp://julius.sourceforge.jp/\fR +.SH "DIAGNOSTICS" +.PP +正常終了した場合,Julius は exit status として 0 を返します.エラーが見付かった場合は異常終了し, exist status として 1 を返します. 入力ファイルが見つからない場合やうまく読み込めなかった場合は,そのファ イルに対する処理をスキップします. +.SH "BUGS" +.PP +使用できるモデルにはサイズやタイプに若干の制限があります.詳しく はパッケージに付属のドキュメントを参照してください. バグ報告・問い合わせ・コメントなどは julius\-info****@lists***** までお願いします. +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "AUTHORS" +.PP +Rev.1.0 (1998/02/20) +.RS 3n +設計:河原達也と李 晃伸 (京都大学) +.sp +実装:李 晃伸 (京都大学) +.RE +.PP +Rev.1.1 (1998/04/14), Rev.1.2 (1998/10/31), Rev.2.0 (1999/02/20), Rev.2.1 (1999/04/20), Rev.2.2 (1999/10/04), Rev.3.0 (2000/02/14), Rev.3.1 (2000/05/11) +.RS 3n +実装:李 晃伸 (京都大学) +.RE +.PP +Rev.3.2 (2001/08/15), Rev.3.3 (2002/09/11), Rev.3.4 (2003/10/01), Rev.3.4.1 (2004/02/25), Rev.3.4.2 (2004/04/30) +.RS 3n +実装:李 晃伸 (奈良先端科学技術大学院大学) +.RE +.PP +Rev.3.5 (2005/11/11), Rev.3.5.1 (2006/03/31), Rev.3.5.2 (2006/07/31), Rev.3.5.3 (2006/12/29), Rev.4.0 (2007/12/19), Rev.4.1 (2008/09) +.RS 3n +実装:李 晃伸 (名古屋工業大学) +.RE +.SH "THANKS TO" +.PP +このプログラムは Rev.3.1 まで,情報処理振興事業協会(IPA)独創的情報技術育 成事業「日本語ディクテーションの基本ソフトウェアの開発」(代表者:鹿野 清宏 奈良先端科学技術大学院大学教授)の援助を受けて行われました. Rev.3.4.2までは「情報処理学会 連続音声認識コンソーシアム」において公開さ れました. +.PP +3.x 時代のマルチプラットフォーム DLL版 は,板野秀樹氏(現名城大学)の手 によって作成・公開されました.また,Windows Microsoft Speech API対応版は 住吉貴志氏(京都大学・当時)の手によるものです. +.PP +そのほか,上記の協力・貢献してくださった方々,およびさまざまな助言・コ メントをいただく関係者各位に深く感謝いたします. +.SH "REFERENCES" +.TP 3 +1.\ http://julius.sourceforge.jp/ +\%http://julius.sourceforge.jp/en/ Index: julius4/man/ja/mkbingram.1 diff -u /dev/null julius4/man/ja/mkbingram.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/mkbingram.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,85 @@ +.\" Title: + mkbingram + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "MKBINGRAM" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + mkbingram + \- バイナリ N\-gram 変換 +.SH "概要" +.HP 10 +\fBmkbingram\fR [\-nlr\ \fIforward_ngram.arpa\fR] [\-nrl\ \fIbackward_ngram.arpa\fR] [\-d\ \fIold_bingram_file\fR] {output_bingram_file} +.SH "DESCRIPTION" +.PP +mkbingram は,ARPA形式の N\-gram 定義ファイルをJulius用のバイナリN\-gram ファイルに変換するツールです.あらかじめ変換しておくことで,Juliusの起 動を大幅に高速化できます. +.PP +Julius\-4より,N\-gram は前向き,後ろ向き,あるいは両方を指定できるよう になりました.mkbingram でも,どちらか一方だけでバイナリN\-gramを作成するこ とができます.また,両方を指定した場合は,それら2つのN\-gramは一つのバ イナリN\-gramに結合されます. +.PP +前向きN\-gramのみが指定されたとき,mkbingram は 前向きN\-gramだけからバ イナリN\-gramを生成します.このバイナリN\-gramを使うとき,Julius はその 中の 2\-gram を使って第1パスを行い,第2 パ スではその前向き確率から後向 きの確率を,ベイズ則に従って算出しながら認識を行います. +.PP +後向きN\-gramのみが指定されたとき,mkbingramは後ろ向きN\-gramだけからバ イナリN\-gramを生成します.このバイナリN\-gramを使うとき,Julius はその 中の後向き 2\-gram からベイズ則に従って算出しながら第1パスの認識を行い, 第2パスでは後向き N\-gramを使った認識を行います. +.PP +両方が指定されたときは,前向きN\-gram中の2\-gramと後向きN\-gramが統合され たバイナリN\-gramが生成されます.Juliusではその前向き2\-gramで第1パスを 行い,後向きN\-gramで第2パスを行います.なお両 N\-gram は同一のコーパス から同 一の条件(カットオフ値,バックオフ計算方法等)で学習されてあり, 同一の語彙を持っている必要があります. +.PP +なお,mkbingram は gzip 圧縮された ARPA ファイルもそのまま読み込めます. +.PP +バージョン 3.x 以前で作成したバイナリN\-gramは,そのまま 4.0 でも読めま す.mkbingram に +\fB\-d\fR +で与えることで,古いバイナリ形式 を新しいバイナリ形式に変換することもできます.なお,4.0 以降の mkbingram で作成したバイナリN\-gramファイルは3.x 以前のバージョンでは 使えませんのでご注意ください. +.SH "OPTIONS" +.PP +\fB \-nlr \fR \fIforward_ngram.arpa\fR +.RS 3n +前向き(left\-to\-right)のARPA形式 N\-gram ファイルを読み込む +.RE +.PP +\fB \-nrl \fR \fIbackward_ngram.arpa\fR +.RS 3n +後ろ向き(right\-to\-left)のARPA形式 N\-gram ファイルを読み込む +.RE +.PP +\fB \-d \fR \fIold_bingram_file\fR +.RS 3n +バイナリN\-gramを読み込む(古いバイナリ形式の変換用) +.RE +.PP +\fIoutput_bingram_file\fR +.RS 3n +出力先のバイナリN\-gramファイル名 +.RE +.SH "EXAMPLES" +.PP +ARPA形式の N\-gram をバイナリ形式に変換する(前向き+後ろ向き): +.sp .RS 3n .nf % \fBmkbingram\fR \-nlr 2gram.arpa \-nrl rev\-Ngram.arpa outfile .fi .RE +ARPA形式の前向き 4\-gram をバイナリ形式に変換する(前向きのみ): +.sp .RS 3n .nf % \fBmkbingram\fR \-nlr 4gram.arpa outfile .fi .RE +古いバイナリN\-gramファイルを現在の形式に変換する: +.sp .RS 3n .nf % \fBmkbingram\fR \-d old_bingram new_bingram .fi .RE +.SH "SEE ALSO" +.PP + +\fB julius \fR( 1 ) +, +\fB mkbinhmm \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/mkbinhmm.1 diff -u /dev/null julius4/man/ja/mkbinhmm.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/mkbinhmm.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,73 @@ +.\" Title: + mkbinhmm + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "MKBINHMM" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + mkbinhmm + \- バイナリ HMM 変換 +.SH "概要" +.HP 9 +\fBmkbinhmm\fR [\-htkconf\ \fIHTKConfigFile\fR] {hmmdefs_file} {binhmm_file} +.SH "DESCRIPTION" +.PP +mkbinhmm は,HTKのアスキー形式のHMM定義ファイルを,Julius用のバイナ リ形式へ変換します.これを使うことで Juliusの起動を高速化することができます. +.PP +この音響モデルの特徴抽出条件を出力ファイルのヘッダに埋め込むことができ ます.埋め込むには,学習時に特徴量抽出に用いた HTK Config ファイルを "\fB\-htkconf\fR" で指定します.ヘッダに抽出条件を埋め込むことで, 認識時に自動的に必要な特徴抽出パラメータがセットされるので,便利です. +.PP +入力として,HTKアスキー形式のほかに,既に変換済みのJulius用バイナリHMM を与えることもできます.\fB\-htkconf\fR +と併用すれば, 既存のバイナリHMMに特徴量抽出条件パラメータを埋め込むことができます. +.PP +mkbinhmm は gzip 圧縮されたHMM定義ファイルをそのまま読み込めます. +.SH "OPTIONS" +.PP +\fB \-htkconf \fR \fIHTKConfigFile\fR +.RS 3n +学習時に特徴量抽出に使用したHTK Configファイルを指定する.指定さ れた場合,その中の設定値が出力ファイルのヘッダに埋め込まれる. 入力に既にヘッダがある場合上書きされる. +.RE +.PP +\fIhmmdefs_file\fR +.RS 3n +変換元の音響モデル定義ファイル (MMF).HTK ASCII 形式,あるいは Julius バイナリ形式. +.RE +.PP +\fIhmmdefs_file\fR +.RS 3n +Julius用バイナリ形式ファイルの出力先. +.RE +.SH "EXAMPLES" +.PP +HTK ASCII 形式の HMM 定義をバイナリ形式に変換する: +.sp .RS 3n .nf % \fBmkbinhmm\fR hmmdefs.ascii binhmm .fi .RE +HTKの設定ファイル Config の内容をヘッダに書き込んで出力: +.sp .RS 3n .nf % \fBmkbinhmm\fR \-htkconf Config hmmdefs.ascii binhmm .fi .RE +古いバイナリ形式ファイルにヘッダ情報だけ追加する: +.sp .RS 3n .nf % \fBmkbingram\fR \-htkconf Config old_binhmm new_binhmm .fi .RE +.SH "SEE ALSO" +.PP + +\fB julius \fR( 1 ) +, +\fB mkbingram \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/mkbinhmmlist.1 diff -u /dev/null julius4/man/ja/mkbinhmmlist.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/mkbinhmmlist.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,73 @@ +.\" Title: + mkbinhmmlist + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "MKBINHMMLIST" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + mkbinhmmlist + \- HMMList ファイルをバイナリ形式に変換 +.SH "概要" +.HP 13 +\fBmkbinhmmlist\fR {hmmdefs_file} {HMMList_file} {output_binhmmlist_file} +.SH "DESCRIPTION" +.PP +mkbinhmmlist は,主にトライフォンとともに使用される HMMList ファイルを バイナリ形式に変換します.通常のテキスト形式の代わりにこれを使うことで Juliusの起動を高速化することができます. +.PP +変換には,HMMList ファイルのほかに,一緒に使う音響モデル定義ファイル +\fIhmmdefs_file\fR +が必要です(HTK ASCII形式 / Juliusバイナリ形式のどちらも可). +.PP +Julius で使用する際には,通常のテキスト形式と同じく "\fB\-hlist\fR" オプションで指定します. テキスト形式かバイナリ形式かの判定は Julius 側で自動的に行われます. +.PP +mkbinhmmlist は gzip 圧縮されたファイルをそのまま読み込めます. +.SH "OPTIONS" +.PP +\fIhmmdefs_file\fR +.RS 3n +音響モデル定義ファイル.HTK ASCII 形式,あるいはJulius バイナ リ形式. +.RE +.PP +\fIHMMList_file\fR +.RS 3n +変換対象の HMMList ファイル. +.RE +.PP +\fIoutput_binhmmlist_file\fR +.RS 3n +出力先となるJulius用バイナリ形式HMMListファイル.すでに ある場合は上書きされる. +.RE +.SH "EXAMPLES" +.PP +HMMList ファイル +\fIlogicalTri\fRをバイナリ形式に変換して +\fIlogicalTri.bin\fR +に保存する: +.sp .RS 3n .nf % \fBmkbinhmmlist\fR binhmm logicalTri logicalTri.bin .fi .RE +.SH "SEE ALSO" +.PP + +\fB julius \fR( 1 ) +, +\fB mkbinhmm \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/mkdfa.pl.1 diff -u /dev/null julius4/man/ja/mkdfa.pl.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/mkdfa.pl.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,95 @@ +.\" Title: + mkdfa.pl + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "MKDFA.PL" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + mkdfa.pl + \- Julius 形式の文法をオートマトンに変換するコンパイラ +.SH "概要" +.HP 9 +\fBmkdfa.pl\fR [\fIoptions\fR...] {prefix} +.SH "DESCRIPTION" +.PP +mkdfa.pl は Julius の文法コンパイラです.記述された文法ファイル (.grammar) と語彙ファイル (.voca) から,Julius用の有限状態オートマトン ファイル (.dfa) および認識辞書 (.dict) を生成します.カテゴリ名と生成 後の各ファイルで用いられるカテゴリ ID 番号との対応が .term ファイルと して出力されます. +.PP +各ファイル形式の詳細については,別途ドキュメントをご覧下さい. +.PP + +prefix +は,.grammar ファイルおよび .vocaファイルの プレフィックスを引数として与えます.prefix.grammarと +prefix.vocaからprefix.dfa, +prefix.dictおよび +prefix.termが生成されます. +.PP +バージョン 3.5.3 以降の Julius に付属の +\fBmkdfa.pl\fR +は, +\fBdfa_minimize\fR +を内部で自動的に呼び出すので, 出力される .dfa は常に最小化されています. +.SH "OPTIONS" +.PP +\fB \-n \fR +.RS 3n +辞書を出力しない..voca 無しで .grammar のみを .dfa に変換する ことができる. +.RE +.SH "ENVIRONMENT VARIABLES" +.PP +\fB \fR\fB\fBTMP\fR\fR\fB または \fR\fB\fBTEMP\fR\fR\fB \fR +.RS 3n +変換中に一時ファイルを置くディレクトリを指定する. 指定が無い場合, +\fI/tmp\fR, +\fI/var/tmp\fR, +\fI/WINDOWS/Temp\fR, +\fI/WINNT/Temp\fR +の順で最初に見つかった場所が使用される. +.RE +.SH "EXAMPLES" +.PP +文法ファイル +\fIfoo.grammar\fR, +\fIfoo.voca\fRに 対して以下を実行することで +\fIfoo.dfa\fRと +\fIfoo.voca\fRおよび\fIfoo.term\fRが出力される. +.sp .RS 3n .nf % \fBmkdfa.pl\fR foo .fi .RE +.SH "SEE ALSO" +.PP + +\fB julius \fR( 1 ) +, +\fB generate \fR( 1 ) +, +\fB nextword \fR( 1 ) +, +\fB accept_check \fR( 1 ) +, +\fB dfa_minimize \fR( 1 ) +.SH "DIAGNOSTICS" +.PP +mkdfa.pl は内部で +\fBmkfa\fR +および +\fBdfa_minimize\fR +を呼び出します.実行時,これらの実行ファ イルが,この mkdfa.pl と同じディレクトリに置いてある必要があります. これらはJulius に同梱されています. +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/mkgshmm.1 diff -u /dev/null julius4/man/ja/mkgshmm.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/mkgshmm.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,53 @@ +.\" Title: + mkgshmm + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "MKGSHMM" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + mkgshmm + \- モノフォンHMMを GMS 用に変換する +.SH "概要" +.HP 8 +\fBmkgshmm\fR {monophone_hmmdefs} + > + {outputfile} +.SH "DESCRIPTION" +.PP +mkgshmm はHTK形式のmonophone HMMを Julius の Gaussian Mixture Selection (GMS) 用に変換するperlスクリプトです. +.PP +GMSはJulius\-3.2からサポートされている音響尤度計算の高速化手法です. フレームごとに monophone の状態尤度に基づいてtriphoneやPTMの状態を予 備選択することで,音響尤度計算が高速化されます. +.SH "EXAMPLES" +.PP +まずターゲットとするtriphoneやPTMに対して,同じコーパスで学習した monophone モデルを用意します. +.PP +次にそのmonophoneモデルを mkgshmm を用いて GMS 用に変換します. +.sp .RS 3n .nf % \fBmkgshmm\fR monophone > gshmmfile .fi .RE +これを Julius で "\fB\-gshmm\fR" で指定します. +.sp .RS 3n .nf % \fBjulius\fR \-C ... \-gshmm gshmmfile .fi .RE +GMS用モデルはtriphoneやPTMと同一のコーパスから作成する必要がある点に注 意してください.gshmm がミスマッチだと選択誤りが生じ,性能が劣化します. +.SH "SEE ALSO" +.PP + +\fB julius \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/mkss.1 diff -u /dev/null julius4/man/ja/mkss.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/mkss.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,63 @@ +.\" Title: + mkss + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "MKSS" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + mkss + \- スペクトルサブトラクション用のノイズスペクトル計算 +.SH "概要" +.HP 5 +\fBmkss\fR [\fIoptions\fR...] {filename} +.SH "DESCRIPTION" +.PP +mkss は,スペクトルサブトラクション用のノイズスペクトル計算ツールです. 指定時間分の音声のない雑音音声をマイク入力から録音し, その短時間スペクトラムの平均を ファイルに出力します.出力されたファイルは,Julius でスペクトル サブトラクションのためのノイズスペクトルファイル(オプション "\fB\-ssload\fR")として使用できます. +.PP +録音は起動と同時に開始します.サンプリング条件は16bit signed short (big endian), monoral で固定です.既に同じ名前のファイルが存在する場合 は上書きします.また,ファイル名に "\-" を指定するこ とで標準出力へ出力できます. +.SH "OPTIONS" +.PP +\fB \-freq \fR \fIHz\fR +.RS 3n +音声のサンプリング周波数 (Hz) を指定する.(default: 16,000) +.RE +.PP +\fB \-len \fR \fImsec\fR +.RS 3n +録音する時間長をミリ秒単位で指定する(default: 3000) +.RE +.PP +\fB \-fsize \fR \fIsample_num\fR +.RS 3n +窓サイズをサンプル数で指定 (default: 400). +.RE +.PP +\fB \-fshift \fR \fIsample_num\fR +.RS 3n +フレームシフト幅をサンプル数で指定 (default: 160). +.RE +.SH "SEE ALSO" +.PP + +\fB julius \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます. Index: julius4/man/ja/nextword.1 diff -u /dev/null julius4/man/ja/nextword.1:1.1 --- /dev/null Thu Oct 2 17:23:48 2008 +++ julius4/man/ja/nextword.1 Thu Oct 2 17:23:48 2008 @@ -0,0 +1,104 @@ +.\" Title: + nextword + +.\" Author: +.\" Generator: DocBook XSL Stylesheets v1.71.0 <http://docbook.sf.net/> +.\" Date: 10/02/2008 +.\" Manual: +.\" Source: +.\" +.TH "NEXTWORD" "1" "10/02/2008" "" "" +.\" disable hyphenation +.nh +.\" disable justification (adjust text to left margin only) +.ad l +.SH "名前" + + nextword + \- DFA 文法で(逆向きに)次単語を予測するツール +.SH "概要" +.HP 9 +\fBnextword\fR [\-t] [\-r] [\-s\ \fIspname\fR] [\-v] {prefix} +.SH "DESCRIPTION" +.PP +nextword は,\fBmkdfa.pl\fR +によって変換された DFA 文法 上で,与えられた部分文に対して接続しうる次単語の集合を出力します. +.PP +実行には .dfa, .dict, .term の各ファイルが必要です. あらかじめ +\fBmkdfa.pl\fR +で生成しておいて下さい. +.PP +!注意! +\fBmkdfa.pl\fR +で出力される文法は,元の 文法と異なり,文の後ろから前に向かう逆向きの文法となっています. これは,Julius の第2パスで後ろ向きの探索を行うためです. このため,nextword で与える部分文も逆向きとなります. +.SH "OPTIONS" +.PP +\fB \-t \fR +.RS 3n +単語ではなくカテゴリ名で入力・出力する. +.RE +.PP +\fB \-r \fR +.RS 3n +単語を逆順に入力する. +.RE +.PP +\fB \-s \fR \fIspname\fR +.RS 3n +スキップすべきショートポーズ単語の名前を指定する. (default: "sp") +.RE +.PP +\fB \-v \fR +.RS 3n +デバッグ出力. +.RE +.SH "EXAMPLES" +.PP +vfr (フィッティングタスク用文法) での実行例: +.sp +.RS 3n +.nf +% nextword vfr +Reading in dictionary...done +Reading in DFA grammar...done +Mapping dict item <\-> DFA terminal (category)...done +Reading in term file (optional)...done +42 categories, 99 words +DFA has 135 nodes and 198 arcs +\-\-\-\-\- +wseq > に して 下さい silE +[wseq: に して 下さい silE] +[cate: (NI|NI_AT) SURU_V KUDASAI_V NS_E] +PREDICTED CATEGORIES/WORDS: + KEIDOU_A (派手 地味 ) + BANGOU_N (番 ) + HUKU_N (服 服装 服装 ) + PATTERN_N (チェック 縦縞 横縞 ...) + GARA_N (柄 ) + KANZI_N (感じ ) + IRO_N (色 ) + COLOR_N (赤 橙 黄 ...) +wseq > +.fi +.RE +.sp +.SH "SEE ALSO" +.PP + +\fB mkdfa.pl \fR( 1 ) +, +\fB generate \fR( 1 ) +, +\fB accept_check \fR( 1 ) +.SH "COPYRIGHT" +.PP +Copyright (c) 1991\-2008 京都大学 河原研究室 +.PP +Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) +.PP +Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 +.PP +Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム +.SH "LICENSE" +.PP +Julius の使用許諾に準じます.