·设为首页收藏本站📧邮箱修改🎁免费下载专区💎积分✅卡密📒收藏夹👽聊天室
返回列表 发布新帖

【求助】百度抓取问题

163 3
发表于 2023-9-22 14:19:38 | 查看全部 阅读模式

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
网站只有2个目录A目录和B目录,这个时候生成了一个页面,给他的id是111,并且分配到A目录,这个时候https:/XXXX/A/111.html打开是正常的,百度蜘蛛过来抓取也是正常的;但是百度蜘蛛也顺道自己抓取了一个https:/XXXX/B/111.html,因为这个页面的id只分配到了A目录,百度蜘蛛如果抓取到B目录,B目录是没有这个id的,势必会导致百度蜘蛛过来抓取的B目录的111.html是404
如果再在A目录产生了一个页面id是222
百度蜘蛛会抓取https:/XXXX/A/222.html还有https:/XXXX/B/222.html(因为B目录没有id222,所以这个页面百度蜘蛛过来抓取是404)
类推就是产生了10个页面,蜘蛛会抓取20次,A目录抓取10次,B目录抓取10次, 但是在B目录的都是抓取的404.
这种有没有大佬可以解决的啊!
我要说一句 收起回复
创宇盾启航版免费网站防御网站加速服务

评论3

婷姐Lv.8 发表于 2023-9-22 14:20:20 | 查看全部
没碰到过呢
我要说一句 收起回复
IT618发布Lv.8 发表于 2023-9-22 14:20:58 | 查看全部
看不懂。
我要说一句 收起回复
浅生Lv.8 发表于 2023-9-22 14:21:22 | 查看全部
你难为住我了,我想我语文老师了
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

图文热点
创宇盾启航版免费网站防御网站加速服务
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:3.137.217.242,GMT+8, 2024-11-17 00:05 , Processed in 0.312001 second(s), 97 queries , Gzip On, Redis On.

Powered by Discuz! X5.0 Licensed

© 2001-2024 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表