hamada
bungu****@leo*****
2004年 4月 27日 (火) 16:49:02 JST
こんにちわ。 On Tue, 27 Apr 2004 11:24:06 +0900 TAMURA Toshihiko <tamur****@bitsc*****> wrote: > 現在のロボット型検索エンジンは、 > パラメータ付きURLはきちんと捕捉していますね。 あう、そうなんですか。当方の検索エンジンに関する知識はもう古いんですね。 > MSNの検索結果からのアクセスログは次のようなものですので、 > ログから探せば確認できます。 早速検索してみました。 ・ログからmsnをgrepした結果からosCsidを検索する 結果>なにもない 実際にmsnをgrepした結果をみてみても、msn経由のリクエストは /catalog/default.php/cPath/102 /catalog/default.php/cPath/41_75 /catalog/product_info.php/cPath/23_168/products_id/1229 /catalog/default.php/manufacturers_id/28 全部↑こんな感じのクリーンなURIでリクエストされてまして、後ろに余計なパ ラメータの付いたURIでのアクセスは皆無でした。 そんなこともありまして、当方は 「クローラーはosCommerceのリンクを追わないようだ」 と思い込んでしまったようです。実際、当方の手元のログではそうとしか見えま せん。 これは素のHTMLでサイトマップを作るmklist/mklist2の副作用(?)なのかもし れませんが、どうもPageRankが高いサイトでは低いサイトよりもGooglebotが強 くリンクを追う傾向があるみたい→田村さんがサンプルとされているサイトは PageRankが高く、当方のサイトが低いだけな可能性も充分ありえます(^^;; > # セッションIDにあたるパラメータをわざわざ削除して > # 掲載しているように見えます。 Googleに関してはこんな記事が有りました。 http://jeff.ecjapan.jp/archives/000040.html > 簡単に言うと、クローラーごとに違うセッションIDを発行されてしまい、違う > URLだけど同じ中身というページを延々と集める羽目になるのを避けるため、セッ > ションIDの入ったURLは集めません、ということです。 まぁこのGoogleGuyの発言は半年も前の話ですので、今は状況が違う可能性もな いではないのですが…。 セッションIDと通常のパラメーターとを判別するのはとても難しいと思われる→ 「一般的なセッションIDに使われる引数」を辞書で持ってて、パターンマッチン グで後ろを切り捨ててる可能性も、無いとは言えません。 > ●session.referer_check について ようやく理解出来ました。ありがとうございます。 ・セッションID付きで呼び出されて ・自サイトからのRefererじゃない 場合にセッションIDをつけ直すという設定なんですね。 当方、なんとなくリクエストURIとRefererを混同してまして、多数のブラウザに 同じセッションID付きのURLを貼り付けて 「どうして各々セッションIDが変わらないんだろう??」 と、暫く本気で悩んでました。考えてみると、このやり方ではRefererが空にな りますんで、session.referer_checkが効く訳ないです(^_^;) > セッションハイジャックが怖いのは、 > 現象が起きたときに教えてくれるお客さんでもいなければ、 > ショップの管理者は確認することもできなくて、 > 信頼をなくしてしまうということだと思います。 ですね。 「ショップから違う名前で呼び掛けられて、アカウントを覗いたらまったくの他 人のものだった」 という状況は、ショップ側から見て悪夢に近いです。 というか、これってもしかしなくても(小規模ですが)「個人情報漏洩」にあた るんじゃないでしょか?? いま、いちばん叱られることですよね。 これは真面目に対策しとかないと…。 はまだ