[Tep-j-general] Re: セッションハイジャック対策

Back to archive index

hamada bungu****@leo*****
2004年 4月 27日 (火) 16:49:02 JST


こんにちわ。

On Tue, 27 Apr 2004 11:24:06 +0900
TAMURA Toshihiko <tamur****@bitsc*****> wrote:

> 現在のロボット型検索エンジンは、
> パラメータ付きURLはきちんと捕捉していますね。

あう、そうなんですか。当方の検索エンジンに関する知識はもう古いんですね。

> MSNの検索結果からのアクセスログは次のようなものですので、
> ログから探せば確認できます。

早速検索してみました。

・ログからmsnをgrepした結果からosCsidを検索する

結果>なにもない

実際にmsnをgrepした結果をみてみても、msn経由のリクエストは

/catalog/default.php/cPath/102
/catalog/default.php/cPath/41_75
/catalog/product_info.php/cPath/23_168/products_id/1229
/catalog/default.php/manufacturers_id/28

全部↑こんな感じのクリーンなURIでリクエストされてまして、後ろに余計なパ
ラメータの付いたURIでのアクセスは皆無でした。

そんなこともありまして、当方は

「クローラーはosCommerceのリンクを追わないようだ」

と思い込んでしまったようです。実際、当方の手元のログではそうとしか見えま
せん。

これは素のHTMLでサイトマップを作るmklist/mklist2の副作用(?)なのかもし
れませんが、どうもPageRankが高いサイトでは低いサイトよりもGooglebotが強
くリンクを追う傾向があるみたい→田村さんがサンプルとされているサイトは
PageRankが高く、当方のサイトが低いだけな可能性も充分ありえます(^^;;

> # セッションIDにあたるパラメータをわざわざ削除して
> # 掲載しているように見えます。

Googleに関してはこんな記事が有りました。

http://jeff.ecjapan.jp/archives/000040.html

> 簡単に言うと、クローラーごとに違うセッションIDを発行されてしまい、違う
> URLだけど同じ中身というページを延々と集める羽目になるのを避けるため、セッ
> ションIDの入ったURLは集めません、ということです。

まぁこのGoogleGuyの発言は半年も前の話ですので、今は状況が違う可能性もな
いではないのですが…。

セッションIDと通常のパラメーターとを判別するのはとても難しいと思われる→
「一般的なセッションIDに使われる引数」を辞書で持ってて、パターンマッチン
グで後ろを切り捨ててる可能性も、無いとは言えません。

> ●session.referer_check について

ようやく理解出来ました。ありがとうございます。

・セッションID付きで呼び出されて
・自サイトからのRefererじゃない

場合にセッションIDをつけ直すという設定なんですね。

当方、なんとなくリクエストURIとRefererを混同してまして、多数のブラウザに
同じセッションID付きのURLを貼り付けて

「どうして各々セッションIDが変わらないんだろう??」

と、暫く本気で悩んでました。考えてみると、このやり方ではRefererが空にな
りますんで、session.referer_checkが効く訳ないです(^_^;)

> セッションハイジャックが怖いのは、
> 現象が起きたときに教えてくれるお客さんでもいなければ、
> ショップの管理者は確認することもできなくて、
> 信頼をなくしてしまうということだと思います。

ですね。

「ショップから違う名前で呼び掛けられて、アカウントを覗いたらまったくの他
人のものだった」

という状況は、ショップ側から見て悪夢に近いです。

というか、これってもしかしなくても(小規模ですが)「個人情報漏洩」にあた
るんじゃないでしょか?? いま、いちばん叱られることですよね。

これは真面目に対策しとかないと…。

はまだ






Tep-j-general メーリングリストの案内
Back to archive index