·设为首页收藏本站📧邮箱修改🎁免费下载专区💎积分✅卡密📒收藏夹👽聊天室
12下一页
返回列表 发布新帖

使用PHP巧妙提取微信公众号文章内容标题等信息精髓

206 12
发表于 2024-8-14 19:44:06 | 查看全部 阅读模式

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
我们以同步阅读”,“香落尘外”,“神州文艺”等微信公众号为例子!其他有用第三方编辑器的微信公众号请在正则里面继续添加规则!此代码良好适配默认的微信公众号发布平台!
  1. <?php $url = @$_GET['url']?$_GET['url']:"https://mp.weixin.qq.com/s/n-X7v_JBFTSM6kBYyIG5kg"; $headers = array( 'Host' => 'mmbiz.qpic.cn', 'Connection' => 'keep-alive', 'Pragma' => 'no-cache', 'Refererr'=>'http://www.qq.com/', 'Cache-Control' => 'no-cache', 'Accept' => 'textml,application/xhtml+xml,application/xml;q=0.9,image/webp,/;q=0.8', 'User-Agent' => 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.89 Safari/537.36', 'Accept-Encoding' => 'gzip, deflate, sdch', 'Accept-Language' => 'zh-CN,zh;q=0.8,en;q=0.6,zh-TW;q=0.4' ); $ch = curl_init(); curl_setopt($ch, CURLOPT_URL,$url); curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 0); curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0); curl_setopt($ch, CURLOPT_HTTPHEADER,$headers); $result= curl_exec($ch); curl_close($ch); preg_match_all('/meta name="author" content="(.*?)"/', $result, $m);   $nickname = $m[1][0];//公众号昵称 preg_match_all('/property="og:title" content="(.*?)"/', $result, $m);   $title = $m[1][0];//公众号文章标题 preg_match_all('/property="og:image" content="(.*?)"/', $result, $m);   $titlepic = $m[1][0];//公众号文章标题图片 preg_match_all('/name="description" content="(.*?)"/', $result, $m);   $smalltext = $m[1][0];//公众号文章简介 preg_match_all('/var round_head_img = "(.*?)";/si',$result,$m); $head_img = $m[1][0];//公众号头像  if (!extension_loaded('dom')) {   die('DOMDocument扩展未加载,请检查PHP配置文件。');   }   $dom = new DOMDocument();   try {   $dom->loadHTML($result);   } catch (Exception $e) {   die('加载HTML时出错:' . $e->getMessage());   } foreach ($dom->getElementsByTagName('*') as $tag) {   if ($tag->hasAttribute('style')) {   $tag->removeAttribute('style');   }   }   $newstext = ''; $divtext = $dom->getElementById('js_content');  foreach ($divtext->childNodes as $child) {   $newstext .=$child->ownerDocument->saveHTML($child); } $newstext=strip_tags($newstext, "';   },$newstext);   $replacement = '<$1$2';   $newHtml = preg_replace('/<(\/)?(p|span|br)[^>]*style="[^"]*"/i', $replacement, $newnewstext);   $newHtml = preg_replace('/<p[^>]*style\s*=\s*"\s*[^"]*"\s*>(.*?)<\/p>/i', '$2', $newHtml);  $newHtml= str_replace(array("<p><br></p>", "<p><br></p>"), '', $newHtml);  $wechattext =preg_replace('/<\/strong>|■|<strong>|.*免费订阅|.*文学新高地|.*点击上方/i', '',  $newHtml);  //去头部 $wechattext = preg_replace('~作者简介.*?>|延伸阅读.*|重要公告.*|责任编辑.*|落尘外平台团队.*|作者:.*|</p>香落尘外.*|往期作品回顾.*~', '',$wechattext); //去尾部 $content = [ 'status' => 200, 'msg' => "采集成功", 'newstext' => $wechattext, 'nickname' => $nickname, 'title' => $title, 'url' => $url, 'titlepic' => $titlepic, 'smalltext' => $smalltext, 'head_img' => $head_img, 'time' => date("Y-m-d H:i:s"), 'api_source' => "".$public_r['sitename']."官网地址:".$public_r['add_pcurl']."" ]; $Json=json_encode($content,JSON_PRETTY_PRINT|JSON_UNESCAPED_UNICODE); echo stripslashes($Json);
复制代码
以上就是用代码抓取获取微信公众号文章的相关信息!此举是为了指定目标采集或者搬迁到第三方有可用接口的平台!鉴于小编只是测试并没有深究这个正则式!某些微信公众号利用其他三方发布到微信公账号的文章或许采集或带来不愉快的体验!请在相关注释的地方进行正则匹配!还是那句老话自己动身丰衣足食!本教程都是免费的,只是给不会的小伙伴提供一个范例!如果有好的写法也可以跟我们联系哦!
我要说一句 收起回复
创宇盾启航版免费网站防御网站加速服务

评论12

CrystαlLv.8 发表于 2024-8-14 19:44:57 | 查看全部
代码发不出来!被屏蔽了。删除不了帖子!重新分享一个看看能不能发出来!
我要说一句 收起回复
婷姐Lv.8 发表于 2024-8-14 19:45:18 | 查看全部
谢谢分享
我要说一句 收起回复
TyCodingLv.8 发表于 2024-8-14 19:45:59 | 查看全部
输出结果 使用PHP巧妙提取微信公众号文章内容标题等信息精髓 编辑器,PHP,代码,适配,神州
我要说一句 收起回复
浅生Lv.8 发表于 2024-8-14 19:46:19 | 查看全部
感谢分享
我要说一句 收起回复
婷姐Lv.8 发表于 2024-8-14 19:47:18 | 查看全部
使用PHP巧妙提取微信公众号文章内容标题等信息精髓 编辑器,PHP,代码,适配,神州 太不给面子了。都是自己码的代码。居然抽7次才中1次。
我要说一句 收起回复
浅生Lv.8 发表于 2024-8-14 19:47:25 | 查看全部
编辑居然推送到主页了
我要说一句 收起回复
独家记忆Lv.8 发表于 2024-8-14 19:47:50 | 查看全部
怎么玩?
我要说一句 收起回复
TyCodingLv.8 发表于 2024-8-14 19:48:06 | 查看全部
接口都写了个例子,简单晚饭。就是可以手动采集单篇微信公众号。JS对接此接口,异步返回后再注入你的投稿表单。
我要说一句 收起回复
TyCodingLv.8 发表于 2024-8-14 19:48:58 | 查看全部
能用原生代码写出来 ,也是高手
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

图文热点
创宇盾启航版免费网站防御网站加速服务
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:3.15.31.27,GMT+8, 2024-11-22 07:10 , Processed in 0.259836 second(s), 129 queries , Gzip On, Redis On.

Powered by Discuz! X5.0 Licensed

© 2001-2024 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表