ChaKi.NET (3.16 Revision 653) | 2021-01-23 23:11 |
ChaMame (1.0.4) | 2020-01-14 17:04 |
Patch Files (TextFormatter for ChaKi.NET (2010/11/20)) | 2010-11-21 23:23 |
その他 (CaboCha-0.66/UniDic用モデルファイル) | 2013-02-18 17:00 |
旧版[ChaKi Legacy] (2.1.0 Build 202) | 2008-11-16 23:47 |
平文形式のテキストファイルを、MeCab形式やCaboCha形式に変換するGUIツールです。 句読点等による改行処理や、コマンドラインからMeCabやCaboChaを呼び出す操作を自動的に行います。 文字コードは自動判別します。
本ツールが出力する.mecabや.cabochaファイルの文字コードは、入力ファイルやMeCab辞書等の文字コードに関わらず、常にUTF-8となります。インポート画面ではInput Character CodeにUTF-8を指定してください。
ChaKi.NETからTools→Text2Corpusを選ぶか、またはChaKi.NETに入力ファイルを直接ドラッグ&ドロップします(メニューバーの辺りにドロップします)。
ファイルサイズが大きい場合などは、処理に時間がかかります。変換が終わるまでお待ちください。
処理が完了すると、出力されたファイルの先頭部分が表示されます。ここで、文字化け等の問題が起こっていないかを確認できます。
出力されるファイル名は変更できます。デフォルトでは、変換元ファイルの拡張子を.mecabに変えたものとなります。