.htaccess の検索除けで、
CGIディレクトリをクロール巡回されたくないのです。
まずは、ルートにrobots.txtで、
User-agent: *
Disallow: /cgi/
バイドゥが無視するらしいので、/cgi/内にも.htaccess で、
SetEnvIf User-Agent "Baidu" deny_ua
SetEnvIf User-Agent "Baiduspider" deny_ua
order allow,deny
allow from all
deny from env=deny_ua
と書きました。こうで、バイドゥは排除できると思うのですが、
「バイドゥはダメですよ」と書いてあるのでしょうか?
それとも
「他は許可するけどバイドゥはダメですよ」
と書いてあるのでしょうか?
頭が混乱して良く分からなくなりました。
バイドゥ以外のクローラーが、/cgi/に来ちゃいますか? 回答お願いします<(_ _)>
No.3ベストアンサー
- 回答日時:
>ここに他のクロールが来ないのでしょうか? そこが気になります。
そういうことにはなりません。
バイドゥ以外は.htaccessで何も指定せず、robots.txtのみを置いたのと同じ状態ということです。
もしバイドゥ以外のロボットがrobots.txtを無視すれば、当然収集していく可能性があります。
他のクローラーをrobots.txtで拒否していたのに、
.htaccessで許可になっては意味がなくなると悩んでしまいました・・・
これで一般クローラーをrobots.txtで拒否し、
バイドゥは更に二重で拒否って事で理解できました。
大変、ありがとうございました。
No.2
- 回答日時:
この場合は全てを許可して拒否する条件を個別に指定しますので、
意味合いとしてはバイドゥは拒否、それ以外は許可するという設定ですね。
これはrobots.txtへの影響はありませんので問題ないかと思います。
でも、私のサイトではバイドゥもちゃんとrobots.txtを見てくれていましたけどね。
ご回答ありがとうございます。
この場合、他が許可になっていますよね?
robots.txtで他の検索クローラーを拒否していますが、
.htaccessで許可しているので、この場合は、
ここに他のクロールが来ないのでしょうか? そこが気になります。
No.1
- 回答日時:
私の捉え方が間違えていたら失礼します。
そもそもクローラーのIP情報を調べて主要なIPを弾く仕様にしたらいいと思います
━━━━━━━━━━━━━━━━━━━━
order allow, deny
allow from all
#Google 2010/05/20
deny from 72.14.199.0/25
deny from 209.85.238.0/25
・
・
・
━━━━━━━━━━━━━━━━━━━━
みたいな形式です。
主要所のIP情報なら
http://www.dspt.net/tools/mobile_ip/
こちらのサイト簡単に.htaccessを作成する事が出来ます。
ただこれは許可の為のなので2点修正します。
修正点1
=========
order deny,allow
deny from all
↓ 修正
order allow, deny
allow from all
=========
修正点2
=========
#Google 2010/05/20
allow from 72.14.199.0/25
allow from 209.85.238.0/25
・
・
・
↓ 修正
#Google 2010/05/20
deny from 72.14.199.0/25
deny from 209.85.238.0/25
=========
バイドウなど他の検索エンジンも調べればIP情報が出てくると思うので
こちらを確認してアクセスを遮断すれば良いと思います。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・集中するためにやっていること
- ・テレビやラジオに出たことがある人、いますか?
- ・【お題】斜め上を行くスキー場にありがちなこと
- ・人生でいちばんスベッた瞬間
- ・コーピングについて教えてください
- ・あなたの「プチ贅沢」はなんですか?
- ・コンビニでおにぎりを買うときのスタメンはどの具?
- ・おすすめの美術館・博物館、教えてください!
- ・ことしの初夢、何だった?
- ・【お題】大変な警告
- ・【大喜利】【投稿~1/20】 追い込まれた犯人が咄嗟に言った一言とは?
- ・洋服何着持ってますか?
- ・みんなの【マイ・ベスト積読2024】を教えてください。
- ・「これいらなくない?」という慣習、教えてください
- ・今から楽しみな予定はありますか?
- ・AIツールの活用方法を教えて
- ・【お題】逆襲の桃太郎
- ・自分独自の健康法はある?
- ・最強の防寒、あったか術を教えてください!
- ・【大喜利】【投稿~1/9】 忍者がやってるYouTubeが炎上してしまった理由
- ・歳とったな〜〜と思ったことは?
- ・モテ期を経験した方いらっしゃいますか?
- ・好きな人を振り向かせるためにしたこと
- ・スマホに会話を聞かれているな!?と思ったことありますか?
- ・それもChatGPT!?と驚いた使用方法を教えてください
- ・見学に行くとしたら【天国】と【地獄】どっち?
- ・これまでで一番「情けなかったとき」はいつですか?
- ・この人頭いいなと思ったエピソード
- ・あなたの「必」の書き順を教えてください
- ・14歳の自分に衝撃の事実を告げてください
- ・人生最悪の忘れ物
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
可否と要否の違いは?
-
雑誌記事への掲載・どこまで許...
-
セキュリティーソフトからmsoia...
-
特殊車両通行許可について
-
引き売り(行商)について
-
駅での路上販売
-
よくテレビで昔のVTRを流す時に...
-
Googleでログインすると「googl...
-
古物許可証についてなのですが...
-
許可と可能の違いってなんですか
-
Gメールのmail.google.com ・・...
-
露天営業許可(5年間)と臨時...
-
スーパーとかコンビニ行ってレ...
-
トマトの缶詰って見かけますか
-
会社を辞めデリヘル開業しよう...
-
100円ショップで買ったもの...
-
美容室でお酒をだしたいのです...
-
関税 = custom = duty = tariff...
-
風俗に行くとほとんどの人がイ...
-
ゆで卵 にふてれいた部分が緑に...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
可否と要否の違いは?
-
Googleでログインすると「googl...
-
ユニクロやGUで働いている方に...
-
特殊車両通行許可について
-
Gメールのmail.google.com ・・...
-
社内報への「おススメのお店」...
-
引き売り(行商)について
-
ドコモ・らくらくスマホの初期...
-
Macを使ってるんですが、かなり...
-
雑誌記事への掲載・どこまで許...
-
「無断」と「勝手」の違いについて
-
神戸の観光地の写真を広告に使...
-
【ビジネス日本語】日本語の承...
-
他県での産業廃棄物の処理について
-
許可を取るの反対語が知りたい。
-
路上ライブについて聞きたいで...
-
建設業志望の前科持ち就活生な...
-
古物許可証についてなのですが...
-
セキュリティーソフトからmsoia...
-
アパレル店で飲食物を販売する...
おすすめ情報