TAMURA Toshihiko
tamur****@bitsc*****
2004年 7月 14日 (水) 16:35:49 JST
こんにちは、田村です。 # 永島さん、お久しぶりです。 # ご無沙汰しています。 YSTでインデックス化されているURLのリストを作成して、 インデックス化の傾向を確認してみました。 同一のサイトで、次のような比較しやすいリンク構造がありました。 (1) osCommerce標準のカテゴリーのページ遷移 トップページ ↓ default.php?cPath=100&osCsid=XXX ...第1階層(1-1) ↓ default.php?cPath=200&osCsid=XXX ...第2階層(1-2) (2) 商品一覧ページ(カスタマイズ)のページ遷移 トップページ ↓ c1.php ...第1階層(2-1) ↓ c2.php ...第2階層(2-2) (1)と(2)は、URLパラメータの有無だけが異なっていて、 ページ内のリンク数などは似通っています。 1-1, 1-2, 2-1, 2-2 がインデックス化されている割合を比較すると、 次のようになりました。 1-1 : 100% (14/14) 1-2 : 4% (9/250) 2-1 : 100% (1/1) 2-2 : 100% (14/14) これを見ると、パラメータ付きURLへの第1リンクはインデックス化するけれども、 それに続く第2リンクをインデックス化する率が低いようです。 この結論として、やはり次の2つは利用すべきですね。 o サーチエンジン対策のURLを使用 o Spiderkiller ただし、これらを利用してもインデックス化されるページとされないページが できるようですので、次はこれらの傾向が知りたいですね。 ============================================================ ちなみに、次のような手順でYSTに記録されているURLのリストを 抽出できますので、試してみてください。 1) 次のURLのドメイン部分を変更してクリックして、 YSTのインデックスページを表示し、HTMLを保存します。 ページ数が多くなるときは、下のURLの"b="を301,401...と書き換えます。 http://search.yahoo.co.jp/bin/query?p=www.example.com&n=100 http://search.yahoo.co.jp/bin/query?p=www.example.com&n=100&hc=0&hs=1&&b=101&h=p http://search.yahoo.co.jp/bin/query?p=www.example.com&n=100&hc=0&hs=1&&b=201&h=p HTMLを y1.html y2.html y3.html ... のようなファイル名で保存したとします。 2) 下のようなperlのスクリプトgetystlinks.plを用意して、 次のコマンドでYSTに記録されているURLを抽出します(Linuxで実行した例)。 $ cat y?.html | ./getystlinks.pl | sort > list.txt ------------------------------------------------------------ #!/usr/bin/perl # getystlinks.pl : YST の検索結果からリンクを抽出する。 while (<>) { if (/[0-9]\/\*-(http:\/\/[^\"]*)/) { print $1,"\n"; } } ------------------------------------------------------------ SEOについては、基礎知識がないと話についていけないということを 言われることがあります。 私は「検索にガンガンヒットするホームページの作り方」(翔泳社)などを 参考にしています。 -- 田村敏彦 / 株式会社ビットスコープ E-mail:tamur****@bitsc***** http://www.bitscope.co.jp/