·设为首页收藏本站📧邮箱修改🎁免费下载专区💎积分✅卡密📒收藏夹👽聊天室
返回列表 发布新帖

采集工具是自动识别文章数据结构吗,还是需要提前设定好

85 5
发表于 2023-9-10 18:15:59 | 查看全部 阅读模式

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
好多站长都做过采集吧,我不太明白采集是什么意思,是随便给一个链接,利用采集工具就能分析出网页html的正文、作者、发布时间吗。还是说每一个网站都需要提前写好针对这个网站的内容提取规则。
我要说一句 收起回复
创宇盾启航版免费网站防御网站加速服务

评论5

IT618发布Lv.8 发表于 2023-9-10 18:16:20 | 查看全部
有能直接识别文章正文的,有需要写规则定位的
我要说一句 收起回复
婷姐Lv.8 发表于 2023-9-10 18:17:08 | 查看全部
有能直接识别文章正文的,有需要写规则定位的
我要说一句 收起回复
浅生Lv.8 发表于 2023-9-10 18:17:33 | 查看全部
火车头 很好用  试试吧
我要说一句 收起回复
独家记忆Lv.8 发表于 2023-9-10 18:18:18 | 查看全部
利用页面种固定的源代码,前后截取,这种最常见!
我要说一句 收起回复
IT618发布Lv.8 发表于 2023-9-10 18:19:06 | 查看全部
采集就是类似人工操作
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

创宇盾启航版免费网站防御网站加速服务
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:18.117.184.236,GMT+8, 2024-12-23 04:50 , Processed in 0.208392 second(s), 109 queries , Gzip On, Redis On.

Powered by Discuz! X5.0 Licensed

© 2001-2024 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表