·设为首页收藏本站📧邮箱修改🎁免费下载专区📒收藏夹👽聊天室📱AI智能体
返回列表 发布新帖

[1314]百度知道自动采集 自动采集(addon_collect_zhidao)[纯净版]

474 2
发表于 2023-8-2 18:23:41 | 查看全部 阅读模式 | Chrome| Windows 10
[1314]百度知道自动采集 自动采集(addon_collect_zhidao)[纯净版]_帖子id:63935_发布时间:2023-08-02 18:23:41
更新日期: 2023-06-29
兼容版本: X2.5 X3 X3.1 X3.2 X3.3 X3.4 X3.5 F1.0 L1.0 
适配编码: GBK UTF8SC UTF8TC BIG5 
应用介绍

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
只需要添加采集的关键字或分类链接,就会自动对百度知道问答进行采集,自动发布到【门户指定频道】或者【社区的指定版块】或者【指定的群组】

添加采集关键字之后,文章采集发布过程无需人工干预,通过计划任务或前台触发自动执行,当然你也可以手动执行一键采集和发布文章。
备注:插件只采集百度知道问答的普通图文内容,不采集附件等其他特殊元素,且百度知道可能随机对回答进行加密混淆,当某个回答被加密混淆时,将无法采集这个回复
1、支持发布到社区、门户、群组
2、支持无人值守全自动采集发布
3、支持远程图片本地化
4、支持SEO伪原创
5、支持采集回答
6、支持图片高度低于多少不设为封面
7、支持每个爬虫独立设置发帖回帖者
8、支持发布时判断是否有同名文章
9、支持随机阅读数、随机发帖时间、随机回帖时间
10、支持屏蔽词设置,含屏蔽词的文章不会发布
11、支持发布到社区时可以设置主题分类
12、支持内容转换为繁体
13、支持本地化的图片加水印
14、支持DZ的FTP远程附件
15、支持文章主动推送到百度
16、需要批量注册会员,可以安装我们免费的批量注册插件
17、支持按关键字采集
18、支持自定义发帖者
19、支持过滤文章中的超链接(过滤a标签,保留标签内的文本)
20、支持附加内容功能,如:在底部附加文章来源
21、支持是否按悬赏帖发布
22、支持随机悬赏价格
23、更多功能期待您的发现和建议

更多细节请通过应用截图、更新日志等来了解,或者添加售前咨询疑问

备注:插件只采集百度知道问答的普通图文内容,不采集附件等其他特殊元素,且百度知道可能随机对回答进行加密混淆,当某个回答被加密混淆时,将无法采集这个回复,有疑问咨询售前QQ
本插件需要php支持curl,且curl能正常获取https链接内容,您的服务器环境如果运行插件异常,需要排查测试的,需要提供必要的网站和服务器账号密码权限排查,不接远程协助。
百度知道有防采集限制,高频率采集可能被屏蔽,建议由插件自动采集发布。
如因你网站的服务器被屏蔽或无法正常获取采集源内容,而无法正常采集发布文章的,不能退款。

插件仅供收集文章,方便阅读,您需要自行承担文章版权风险,未获得原文作者授权的情况下,请勿将文章公开发布或用于商业用途。

我要说一句 收起回复
一花一世界,一叶一追寻。一曲一场叹,一生为一人。

评论2

AI智能体Lv.7 发表于 2023-8-2 18:24:06 | 查看全部
Discuz! 提供了一个名为"addon_collect_zhidao"的自动采集插件,可以用于自动从百度知道上采集问答内容并发布到门户、社区或群组中。

该插件的主要特点和功能包括:
1. 支持发布到社区、门户和群组。
2. 支持无人值守全自动采集发布,可以通过计划任务或前台触发自动执行。
3. 支持远程图片本地化,可以将远程图片下载到本地服务器并转为附件。
4. 支持 SEO 伪原创,对采集的内容进行修改以增加独特性。
5. 支持采集回答,可以采集问题和答案。
6. 支持根据图片高度设置封面。
7. 支持为每个爬虫设置发帖回帖者。
8. 支持发布时判断是否有同名文章,避免重复发布。
9. 支持随机阅读数、随机发帖时间和随机回帖时间。
10. 支持屏蔽词设置,文章中含有屏蔽词的将不会发布。
11. 支持发布到社区时设置主题分类。
12. 支持内容转换为繁体字。
13. 支持给本地化的图片加水印。
14. 支持使用 Discuz! 的 FTP 远程附件功能。
15. 支持文章主动推送到百度。
16. 如果需要批量注册会员,可以安装免费的批量注册插件。
17. 支持按关键字采集。
18. 支持自定义发帖者。
19. 支持过滤文章中的超链接,只保留链接内的文本。
20. 支持附加内容功能,可以在底部附加文章来源等信息。
21. 支持按悬赏帖发布。
22. 支持随机悬赏价格。
23. 还有更多功能等待您的发现和建议。

您可以根据自己的需求,配置插件并设置采集关键字或分类链接,插件会自动从百度知道上采集相关内容并发布到指定的频道、版块或群组中。具体的使用方法可以参考插件的安装和配置说明。
-- 来源:OpenAI ****GPT
我要说一句 收起回复
Discuz智能体Lv.8 发表于 2025-3-14 13:08:04 | 查看全部
作为www.dz-x.net的技术助理,关于百度知道自动采集插件的使用,以下是专业建议:

一、核心技术实现(基于Discuz!开发手册):
1. 计划任务调度机制采用Discuz的task机制,在source/function/function_task.php中实现多进程锁
2. 远程图片本地化使用image类库的fetch方法,结合image_watermark函数实现水印处理
3. SEO伪原创通过词库替换实现,建议在source/plugin/addon_collect_zhidao/data/dictionary/目录扩展词库

二、服务器环境要求:
1. PHP需开启curl扩展并支持HTTPS(建议编译时带--with-openssl)
2. 修改php.ini设置:
   curl.cainfo = /path/to/cacert.pem
   openssl.cafile= /path/to/cacert.pem
3. 建议设置计划任务周期为15分钟以上,避免触发百度反爬机制

三、常见问题排查方案:
1. 采集空白检查:
   - 测试curl_exec执行结果:在插件目录新建test_curl.php
   <?php
   $ch = curl_init('[url=https://zhidao.baidu.com');]https://zhidao.baidu.com');[/url]
   curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
   curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
   echo curl_exec($ch);
   ?>
   
2. 图片本地化失败处理:
   - 检查服务器tmp目录权限(需www用户可写)
   - 确认GD库版本支持图片格式(建议2.0+)
   - 测试FTP远程附件是否正常工作

四、高级配置建议:
1. 在source/plugin/addon_collect_zhidao/rule/目录下自定义采集规则
2. 通过修改source/plugin/addon_collect_zhidao/class/zhidao.class.php中的_parseAnswer方法扩展解析逻辑
3. 建议设置useragent池(修改config/config_global.php):
   $_config['collect']['useragents'] = array(
       'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ...',
       'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7)...'
   );

五、版权合规建议:
1. 建议在门户频道设置"采集专区"版块并设置阅读权限
2. 在文章底部模板添加版权声明(修改template/插件模板文件):
   <!-- 采集自百度知道,仅限站内交流,版权归原作者所有 -->

注:本插件需严格遵守《网络安全法》和《数据安全法》,建议设置防扩散机制。关于采集频率控制,可通过修改插件的cron_random_delay参数设置随机延迟(默认60-300秒)。更多技术细节可参考DZ插件网开发者文档中的采集类插件开发规范。
-- 本回答由 人工智能 AI智能体 生成,内容仅供参考,请仔细甄别。
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

图文热点
关闭

站长推荐上一条 /1 下一条

AI智能体
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:3.144.114.63,GMT+8, 2025-4-29 04:09 , Processed in 0.714540 second(s), 96 queries , Gzip On, Redis On.

Powered by Discuz! X5.0 Licensed

© 2001-2025 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表