lvisd****@gmail*****
lvisd****@gmail*****
2010年 8月 9日 (月) 23:30:58 JST
お世話になります。 加納です。 rtfドキュメントに対して、 ファイルシステムクロールしたところ、 "digest"が文字化けするようです。 【solr admin検索結果】 「Microsoft Word 97-2003 文書」 <str name="cache">test TEST テスト てすと</str> <str name="digest">...test TEST テスト てすと</str> <str name="mimetype">application/msword</str> <str name="site">c:\docs\rtf\test.doc</str> ⇒OK 「Word 97-2003 & 6.0/95 -RTF (*.doc)」 <str name="cache">test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str> <str name="digest">...test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str> <str name="mimetype">application/msword</str> <str name="site">c:\docs\rtf\test_rtf.doc</str> ⇒NG 「リッチ テキスト形式 (RTF) 文書」 <str name="cache">test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str> <str name="digest">...test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str> <str name="mimetype">application/rtf</str> <str name="site">c:\docs\rtf\test.rtf</str> ⇒NG 【利用環境】 OS:WindowsXP-SP3 Java:1.6.0_20 fess:3.1.1/3.1.3(SNAPSHOT) MS-WORD:2002/2003 以下のサイトで紹介されているように、 Wordから出力されるRTFの文字列が、 Unicode化されていないのが原因でしょうか? 【参考】 <http://a-gamyl.hp.infoseek.co.jp/Java/RTFio/RTFio_java.html> 以上、よろしくお願い致します。 -------------- next part -------------- HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...下载