Masayuki Shibata
mshib****@shima*****
2010年 1月 7日 (木) 19:19:58 JST
柴田@亀岡市です。 ある Web 型の文書管理サーバーソフトでの話です。 文書ファイルへのリンクは、アイコンボタンの Action として記述されて おり、いわゆる href リンクではないため fess でクロールできていませ ん。 そこでそのサーバーソフトの開発元に何か手はないかとたずねたところ、 「サイトマップ」に対応しているので、それで何とかならないかみたいな 回答がありました。 サイトマップとは... http://www.sitemaps.org/ja/index.php 実際その機能を動かしてみると、指定 URL に sitemapindex.xml と sitemap_0001.xml.gz というファイルが作られていて、前者には後者のポインタ (多分後者が複 数作られるときにインデックス) を含んでおり、後者を展開して得られる XML には... <url> <loc>http://hostname/xxx/htdocs/...</loc> <lastmod>2009-04-23T18:33:01+09:00</lastmod> </url> ...のような文書ファイルへのリンクがズラっと並んで記述されています。 話のやりとりからある種の規格のようなものだと推測されますが、これに 対応できていれば確かにクロールするのに一発で済みそうです。 これについて何かご予定はお持ちでしょうか? ---------- Shibata, Masayuki Manager, Software Development Shimadzu Corporation Analytical Measuring Instruments Division Research & Development Department Telephone: 075-823-1441 Japan Facsimile: 075-823-1365 Japan E-mail: mshib****@shima*****