·设为首页收藏本站📧邮箱修改🎁免费下载专区💎积分✅卡密📒收藏夹👽聊天室
返回列表 发布新帖

如何干掉各搜索引擎的爬虫

289 2

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
很多爬虫,光爬不给流量。恶心、呸。我都替你们臊得慌,你们简直就是土匪!麻子!
比如头条。

如何干掉各搜索引擎的爬虫 如何,干掉,搜索,搜索引擎,引擎
如何干掉各搜索引擎的爬虫 如何,干掉,搜索,搜索引擎,引擎
  1. add_header X-Robots-Tag "noindex, nofollow";
复制代码


2:使用robots.txt文件可以阻止爬虫爬取,但是有些流氓不遵守robots规则,这种方法几乎无效,还是把方法写下来。

打开nginx.conf文件,server段添加如下内容:
  1. location /robots.txt {    default_type text/plain;    return 200 "User-agent: *\nDisallow: /";}
复制代码
保存,重启nginx后,浏览器在主域名后添加 /robots.txt 显示如下,即为成功
  1. User-agent: *Disallow: /
复制代码
3:由于上面的方法不是很凑效,于是俺们还是简单粗暴地使用 http_user_agent 来屏蔽。方法如下,

打开nginx.conf文件,server段添加如下内容:
  1. if ($http_user_agent ~* "Bytespider|SEMrushBot|DuckDuckGo-Favicons-Bot|dark_NeXus_Qbot|360Spider|YisouSpider|YodaoBot|Sosospider|Sogou web spider|msnbot-media|msnbot|ia_archiver|EasouSpider|JikeSpider|ezooms.bot|Twitterbot|Facebot|AhrefsBot|SemrushBot|Baiduspider|YandexBot|YandexMobileBot|DotBot|MJ12bot|bingbot|Java|perl|Python|Wget|Xenu|^$"){return 444;}
复制代码
直接返回444,强制关闭服务器与客户端的连接而不返回任何响应信息给客户端。
我要说一句 收起回复
创宇盾启航版免费网站防御网站加速服务

评论2

TyCodingLv.8 发表于 2022-10-25 11:06:52 | 查看全部
也许用的到,也许也不用,收藏先
我要说一句 收起回复
拾光Lv.8 发表于 2022-10-25 11:07:38 | 查看全部
有时候希望它多爬点,但是很多爬都无用。
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

创宇盾启航版免费网站防御网站加速服务
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:18.116.88.132,GMT+8, 2024-12-23 09:13 , Processed in 0.499010 second(s), 93 queries , Gzip On, Redis On.

Powered by Discuz! X5.0 Licensed

© 2001-2024 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表