[morogram-users] Re: ありがとうございます。

Back to archive index

dune FZH01****@nifty*****
2005年 4月 18日 (月) 00:57:05 JST


極悪です。

ジョウレントモカさんの[morogram-users] ありがとうございます。から
>では一部分だけ添付させていただきます。

添付のファイルは MS-WORD の独自形式で、テキストファイルではないので
morogram では分析できません。OLE という技術を使うと perl で Word 文書
にアクセスして内容を読み取ることもできないことはないですが、面倒くさ
いです。

Word の文書(doc ファイル)を分析しないといけないのでしょうか。内容は
http://sumomo.oiuw.oiu.ac.jp/8/kan9.doc と同じようですが、このファイル
の代わりに http://sumomo.oiuw.oiu.ac.jp/8/kan8.txt を分析すれば良いの
ではと思います。

後者のファイル(txt ファイル)の文字コードは shift-jis になっていて、
表示できない文字は &C0-F6CD;<yan3> といった記号になっています。
&C0-F6CD;<yan3> を &C0F6CD; に変換して、余計な注意書きを削除して、
必要なら段落ごとに分けてファイルに保存してやれば morogram で分析でき
ます。

僕には kan8.txt に書いてある内容がさっぱりわからないので、意味的にど
う扱えばいいかわからずじれったいのですが、kan8.txt を前加工して
morogram に突っ込むのは技術的に難しいことではありません。たぶんその辺
のエディタの操作に慣れた人か、もしくはプログラミングが好きな中高生に
具体的な指示が出せればすぐにやってくれます。
-- 
極悪, mailto:FZH01****@nifty*****




morogram-users メーリングリストの案内
Back to archive index