Shinsuke Sugaya
shins****@yahoo*****
2010年 5月 20日 (木) 15:44:48 JST
菅谷です。 > そもそもどうやってファイルを特定するのでしょうか? ログに出ている [Robot-20100520113221-1-10] という 部分の最後の数字がスレッドごとに異なります。 ですので、[Robot-20100520113221-1-10] と出力されて いるものの中で、それの上に出ているものから特定できます。 クロールしているものは INFO レベルで Crawling URL: http://.. という感じのログで出力されます。 現在、POI 自体をバージョンアップしてあるので、Exception の内容を評価しなければならないと考えています。問題自体は POI の問題なので、なかなか対応も難しいところもありますが…。 shinsuke 2010年5月20日14:41 Masayuki Shibata <mshib****@shima*****>: > 柴田@亀岡市です。 > >>MS Office 系のファイル(たぶん Excel)だと思いますが、 > ... >>ファイルをいただけるようでしたら、確認させていただきたい >>と思います。 > > 製品開発文書置き場の Subversion がクロール先に入っておりますの > でファイルをお出しできない可能性は高いですが... > > そもそもどうやってファイルを特定するのでしょうか? > > ログのその繰り返しが発生する直前の行に登場してくるものだと > Excel、Word 以外にも テキストやHTML (今回見たのは Subversion > のディレクトリリスティング画面) など色々なファイルタイプのもの > があります。 > > 本日1回、Fess を更新してフルでクロールかけたところ 15 箇所で > これが発生しており、ざっとスクロールして見つけた 900行ほど繰り > 返すものだけかと思っておりましたら、2行とか 4行というものもあ > りました。 > #スクロールしながら見ていて流れてしまってました。 > > 中身も色々で、そもそもクロールしても情報が拾えずエラーメッセー > ジが出る類 (Excel ですとマクロを含んでいるので開いたときに確認 > 画面が出るものは、クロールしようにも内容が拾えず、通常は Java > のエラーメッセージがログに出力されているようなものです) もあれ > ば、ごくごく普通に開くことのできる Excel、Word ファイルもあり > ます。 > > _______________________________________________ > Fess-user mailing list > Fess-****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/fess-user >