[morogram-users] Re: Win32 スタンドアロン版 morogram

Back to archive index

dune FZH01****@nifty*****
2003年 11月 4日 (火) 21:28:52 JST


極悪です。

Shigeki Moro さんの Re: Win32 スタンドアロン版 morogram から
>Shigeki Moro さんの Re: Win32 スタンドアロン版 morogram から
>リリース名にマルチバイト文字が使えないというのと関係ないですかね?

どうも僕と SourceForge との相性が悪い?ようで・・・。会社から
アクセスしてみても、しょっちゅう「サーバが見つからない」のエ
ラーになります。

>> それと、リリースメモが Permission Denied と言われて見えませ
>> ん。
>
>すいません、権限を付け忘れました(というか、わかりづらいぞ
>>sourceforge)。今はたぶん、リリースメモを書けると思います。

見えるようにはなりましたが、編集できません。書き換え・修正の
フォームは出るのに、送信しても元の文章は更新されません。

アップしたスタンドアロン版の .zip には使い方の説明を入れてな
いので、リリースノートに書こうとしていたものを、ここに書いて
おきます(書く量が多いから書き込みに失敗しているわけでもなさ
そうです)。



morogram-0.7.1w.exe は morogram のスタンドアロン版です。Perl
や morogram-sort.exe は不要で、このプログラムだけでファイル
を処理できます。文字コードは utf8 専用です。



morogram-0.7.1wCJKT.exe は morogram-0.7.1w.exe に文字コード
変換用モジュールをリンクさせたもので、オプションとして例えば
--shiftjis を指定すると SJIS のテキストを処理できるようにな
ります(将来は Guess モジュールをリンクして文字コードの自動判
別までやりたいなぁ、なんて思ってますがいつになることやら)。

D:% morogram-0.7.1wCJKT.exe --p --g=2, --f=6 --shiftjis D:\DATA\古典\源氏\篝火
morogram: N-gram tool version 0.7.1,
        by Shigeki Moro (moro****@ya*****).

        minimum number of frequency: 6
        minimum number of gram     : 2
        largest number of gram     : 256
        delete punct               : yes
        ignore case                : yes
        regard &Mnnnnnn;           : no
        print BOM                  : no
        filename                   : D:\DATA\古典\源氏\篝火

------- First Stage -------
        creating offset table...done.
        number of characters is 1415.
        offset length is 2.
        creating pointer table...done.
        sorting pointer table...done.
        counting coincidence number of characters...done.
        largest coincidence number is 8.
------- Second Stage ------
        calculating          2-gram frequency.
        deleting temporary file(s)...done.
        Total time: 0 hour(s) 0 minute(s) 1 second(s)
6       したま  3
14      たまふ  3
7       たまへ  3
6       りたま  3
13      いと    2
7       かし    2
6       かな    2
7       こえ    2
7       こそ    2
9       こと    2
10      しき    2
11      した    2
7       して    2
26      たま    2
6       とも    2
6       なり    2
10      なる    2
6       にも    2
14      まふ    2
7       まへ    2
8       もの    2
6       りた    2
6       中将    2
6       出で    2

D:%



使える文字コードは --v で表示できます。EBCDIC-Based encodings
というモジュールもありましたが、今回はリンクしていません。

D:% morogram-0.7.1wCJKT.exe --V
Version: 0.7.1.1.0
7bit-jis                AdobeStandardEncoding   AdobeSymbol
AdobeZdingbat           ascii                   ascii-ctrl
big5-eten               big5-hkscs              cp1006
cp1026                  cp1047                  cp1250
cp1251                  cp1252                  cp1253
cp1254                  cp1255                  cp1256
cp1257                  cp1258                  cp37
cp424                   cp437                   cp500
cp737                   cp775                   cp850
cp852                   cp855                   cp856
cp857                   cp860                   cp861
cp862                   cp863                   cp864
cp865                   cp866                   cp869
cp874                   cp875                   cp932
cp936                   cp949                   cp950
dingbats                euc-cn                  euc-jp
euc-kr                  gb12345-raw             gb2312-raw
gsm0338                 hp-roman8               hz
iso-2022-jp             iso-2022-jp-1           iso-2022-kr
iso-8859-1              iso-8859-10             iso-8859-11
iso-8859-13             iso-8859-14             iso-8859-15
iso-8859-16             iso-8859-2              iso-8859-3
iso-8859-4              iso-8859-5              iso-8859-6
iso-8859-7              iso-8859-8              iso-8859-9
iso-ir-165              jis0201-raw             jis0208-raw
jis0212-raw             johab                   koi8-f
koi8-r                  koi8-u                  ksc5601-raw
MacArabic               MacCentralEurRoman      MacChineseSimp
MacChineseTrad          MacCroatian             MacCyrillic
MacDingbats             MacFarsi                MacGreek
MacHebrew               MacIcelandic            MacJapanese
MacKorean               MacRoman                MacRomanian
MacRumanian             MacSami                 MacSymbol
MacThai                 MacTurkish              MacUkrainian
MIME-B                  MIME-Header             MIME-Q
nextstep                null                    posix-bc
shiftjis                symbol                  UCS-2BE
UCS-2LE                 UTF-16                  UTF-16BE
UTF-16LE                UTF-32                  UTF-32BE
UTF-32LE                utf8                    viscii

        deleting temporary file(s)...done.
        Total time: 0 hour(s) 0 minute(s) 0 second(s)

D:%
-- 
FZH01****@nifty*****
http://hpcgi1.nifty.com/dune/gwiki.pl?




morogram-users メーリングリストの案内
Back to archive index