dune
FZH01****@nifty*****
2005年 4月 18日 (月) 00:57:05 JST
極悪です。 ジョウレントモカさんの[morogram-users] ありがとうございます。から >では一部分だけ添付させていただきます。 添付のファイルは MS-WORD の独自形式で、テキストファイルではないので morogram では分析できません。OLE という技術を使うと perl で Word 文書 にアクセスして内容を読み取ることもできないことはないですが、面倒くさ いです。 Word の文書(doc ファイル)を分析しないといけないのでしょうか。内容は http://sumomo.oiuw.oiu.ac.jp/8/kan9.doc と同じようですが、このファイル の代わりに http://sumomo.oiuw.oiu.ac.jp/8/kan8.txt を分析すれば良いの ではと思います。 後者のファイル(txt ファイル)の文字コードは shift-jis になっていて、 表示できない文字は &C0-F6CD;<yan3> といった記号になっています。 &C0-F6CD;<yan3> を &C0F6CD; に変換して、余計な注意書きを削除して、 必要なら段落ごとに分けてファイルに保存してやれば morogram で分析でき ます。 僕には kan8.txt に書いてある内容がさっぱりわからないので、意味的にど う扱えばいいかわからずじれったいのですが、kan8.txt を前加工して morogram に突っ込むのは技術的に難しいことではありません。たぶんその辺 のエディタの操作に慣れた人か、もしくはプログラミングが好きな中高生に 具体的な指示が出せればすぐにやってくれます。 -- 極悪, mailto:FZH01****@nifty*****