[fess-user 207] Re: 20010-05-17 SNAPSHOT のログで...

Back to archive index

Shinsuke Sugaya shins****@yahoo*****
2010年 5月 20日 (木) 15:44:48 JST


菅谷です。

> そもそもどうやってファイルを特定するのでしょうか?

ログに出ている [Robot-20100520113221-1-10] という
部分の最後の数字がスレッドごとに異なります。
ですので、[Robot-20100520113221-1-10] と出力されて
いるものの中で、それの上に出ているものから特定できます。
クロールしているものは INFO レベルで  Crawling URL: http://..
という感じのログで出力されます。

現在、POI 自体をバージョンアップしてあるので、Exception
の内容を評価しなければならないと考えています。問題自体は
POI の問題なので、なかなか対応も難しいところもありますが…。

shinsuke


2010年5月20日14:41 Masayuki Shibata <mshib****@shima*****>:
> 柴田@亀岡市です。
>
>>MS Office 系のファイル(たぶん Excel)だと思いますが、
> ...
>>ファイルをいただけるようでしたら、確認させていただきたい
>>と思います。
>
> 製品開発文書置き場の Subversion がクロール先に入っておりますの
> でファイルをお出しできない可能性は高いですが...
>
> そもそもどうやってファイルを特定するのでしょうか?
>
> ログのその繰り返しが発生する直前の行に登場してくるものだと
> Excel、Word 以外にも テキストやHTML (今回見たのは Subversion
> のディレクトリリスティング画面) など色々なファイルタイプのもの
> があります。
>
> 本日1回、Fess を更新してフルでクロールかけたところ 15 箇所で
> これが発生しており、ざっとスクロールして見つけた 900行ほど繰り
> 返すものだけかと思っておりましたら、2行とか 4行というものもあ
> りました。
> #スクロールしながら見ていて流れてしまってました。
>
> 中身も色々で、そもそもクロールしても情報が拾えずエラーメッセー
> ジが出る類 (Excel ですとマクロを含んでいるので開いたときに確認
> 画面が出るものは、クロールしようにも内容が拾えず、通常は Java
> のエラーメッセージがログに出力されているようなものです) もあれ
> ば、ごくごく普通に開くことのできる Excel、Word ファイルもあり
> ます。
>
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>




Fess-user メーリングリストの案内
Back to archive index