·设为首页收藏本站📧邮箱修改🎁免费下载专区📒收藏夹👽聊天室📱AI智能体
返回列表 发布新帖

宝塔的安全-地区规则拦截不住恶意爬虫啊

72 3
发表于 昨天 18:35 | 查看全部 阅读模式

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
完全拦截不住,
后面我在网站的配置文件里面加了
if ($http_user_agent ~* "TelegramBot|DataForSeoBot|YandexBot|PetalBot|DotBot|facebookexternalhit|AhrefsBot|MJ12bot|SemrushBot|Slurp|twiceler|Scrubby|Robozilla|GPTBot|facebook|Amazonbot") {
        return 403;




根据您提供的User-Agent拦截规则,结合相关技术规范和实践经验,该配置可实现基础防护,但需针对性优化。具体分析如下:

一、当前规则有效性评估1. ‌已覆盖的典型爬虫‌
    ✅ ‌AI类‌:GPTBot(OpenAI官方爬虫)5、facebookexternalhit(Meta旗下服务)✅ ‌搜索引擎‌:YandexBot(俄语搜索)、PetalBot(华为搜索)、Slurp(雅虎搜索)✅ ‌SEO工具‌:AhrefsBot、SemrushBot(流量分析爬虫)✅ ‌通用爬虫‌:DotBot、MJ12bot、DataForSeoBot(数据抓取类)
2. ‌潜在缺陷‌
    ❗ ‌伪装绕过风险‌:部分爬虫(如Amazonbot)会伪装成普通浏览器UA(如Mozilla/5.0)4❗ ‌遗漏新型爬虫‌:未包含Google-Extended(谷歌AI训练专用爬虫)等新标识4❗ ‌误伤合法服务‌:TelegramBot可能包含Telegram的网页预览功能,拦截可能导致社交分享异常3

二、优化建议方案1. ‌UA名单分层处理‌[backcolor=var(--cos-color-bg-dent)]nginxCopy Code


















# 高风险AI/数据爬虫(强制拦截)if ($http_user_agent ~* "GPTBot|facebookexternalhit|DataForSeoBot|DotBot|AhrefsBot|MJ12bot|SemrushBot|Scrubby") {    return 403;}# 选择性拦截(根据业务需求启用)if ($http_user_agent ~* "YandexBot|PetalBot|Slurp|twiceler|Robozilla|Amazonbot") {    # 先记录日志再拦截    access_log /www/wwwlogs/block_bots.log;    return 403;}# 需谨慎处理的UA(建议监控)if ($http_user_agent ~* "TelegramBot") {    # 允许访问但限制速率    limit_req zone=anti_spider burst=5;}

原理说明
    对高威胁爬虫直接拦截,避免资源消耗15对可能影响用户体验的UA(如TelegramBot)采用限速而非封禁6
2. ‌补充防护措施‌
    ‌动态UA检测‌:在Nginx中增加模糊匹配规则,拦截含Bot/1.0; +http等爬虫特征片段4[backcolor=var(--cos-color-bg-dent)]nginxCopy Code




    if ($http_user_agent ~* "bot/[\d\.]+; \+\https?://") {    return 403;}

    ‌IP黑名单联动‌:将高频请求IP自动加入防火墙黑名单(需配合宝塔「计划任务」实现)8

三、验证与监控

  • ‌日志分析工具‌
    使用grep命令实时监控拦截记录:[backcolor=var(--cos-color-bg-dent)]bashCopy Code


    [color=var(--cos-yellow-1)]tail -f /www/wwwlogs/access.log | grep [color=var(--cos-green-2)]' 403 '‌误拦截排查‌
    在宝塔面板开启「访问限制」白名单功能,允许管理员IP绕过检测7

四、替代方案推荐(增强版)方案类型实施方式优势
‌UA+IP双验证‌结合geoip模块拦截境外IP段1防止国内服务器伪装请求
‌行为分析‌通过limit_req模块限制单IP每秒请求数≤36对抗UA伪装的慢速爬虫
‌动态挑战‌对可疑请求返回JS验证码(需安装Nginx-Lua模块)高效识别真人用户与脚本
我要说一句 收起回复

评论3

独家记忆Lv.8 发表于 昨天 18:36 | 查看全部
没在网站配置设置过  都是防火墙UA黑名单设置  然后记录显示返回444
我要说一句 收起回复
IT618发布Lv.8 发表于 昨天 18:36 | 查看全部
有钱上百度云防护 可以针对性拦截爬虫 也可以买在企业版BOT防护
我要说一句 收起回复
婷姐Lv.8 发表于 昨天 18:37 | 查看全部
买了会员,让客服帮你调试,栏不了,让他退钱
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

图文热点
关闭

站长推荐上一条 /1 下一条

AI智能体
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:18.116.82.202,GMT+8, 2025-4-28 05:45 , Processed in 0.236750 second(s), 78 queries , Gzip On, Redis On.

Powered by Discuz! X5.0 Licensed

© 2001-2025 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表