使用htaccess文件规则阻止特定蜘蛛访问

综合1 2,191,956字数 236阅读0分47秒

互联网上有很多网络爬虫,它们带着各自的任务到处爬行,例如:Baiduspider、Googlebot、bingbot等。这些搜索引擎爬虫爬取收录我们的网站可以给网站带来流量,是有用的。但还有许多垃圾爬虫,对网站没有任何益处,还耗费资源。

对于这些无用的爬虫,我们可以在网站日志logs中分析日志文件,获得爬虫名称使用.htaccess文件规则进行屏蔽。例如:SemrushBot,这是一家靠销售数据的公司,但对于被爬行的网站来说,没有任何价值。文章源自小武站https://1z345.cn/小武站-https://bbs.50-0.cn/926.html

如果在网站根目录中没有看到.htaccess文件,可以参考以下教程创建:文章源自小武站https://1z345.cn/小武站-https://bbs.50-0.cn/926.html

在.htaccess文件中写入如下规则:文章源自小武站https://1z345.cn/小武站-https://bbs.50-0.cn/926.html

SetEnvIfNoCase User-Agent "^SemrushBot" bad_bot
Deny from env=bad_bot

如果要屏蔽多个爬虫,就增加SetEnvIfNoCase行,如下:文章源自小武站https://1z345.cn/小武站-https://bbs.50-0.cn/926.html

SetEnvIfNoCase User-Agent "^SemrushBot" bad_bot
SetEnvIfNoCase User-Agent "^SEOkicks" bad_bot
Deny from env=bad_bot
文章源自小武站https://1z345.cn/小武站-https://bbs.50-0.cn/926.html文章源自小武站https://1z345.cn/小武站-https://bbs.50-0.cn/926.html
如何提高河蚌产珍珠的概率
如何提高河蚌产珍珠的概率 综合

如何提高河蚌产珍珠的概率

要提高河蚌产珍珠的概率,可以从以下几个方面入手: 1. 选种:挑选健康、活力强、壳质良好的河蚌作为种蚌。优良的种蚌具有更好的生理条件和适应性,有助于提高产珠概率。2. 水质管理:保持养殖水域的水质清洁...
阿里妈妈数黑体
阿里妈妈数黑体 综合

阿里妈妈数黑体

阿里妈妈·智造字自产自研打造了第一款AI字体产品——阿里妈妈数黑体正式上线。这款字的生成是人机协同工作的成果,设计原型,智能参与,人工干预,人机循环优化,直到最终生成满意标准字库。 数黑体是基于阿里妈...
  • 本文由 admin 发表于 2024年8月19日 10:48:17
  • 转载请务必保留本文链接:https://bbs.50-0.cn/926.html
  • 屏蔽爬虫
    • 小唐
      小唐

      不错,,,

    匿名

    发表评论

    匿名网友
    :?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:
    确定