·设为首页收藏本站📧邮箱修改🎁免费下载专区💎积分✅卡密📒收藏夹👽聊天室
12
返回列表 发布新帖

万能的站长,我想用python抓取这几个数据,请教该怎么写法

评论19

IT618发布Lv.8 发表于 2023-10-12 15:19:07 | 查看全部
需要登录状态才能多查看些关键词 可以抓爱站的词
我要说一句 收起回复
创宇盾启航版免费网站防御网站加速服务
拾光Lv.8 发表于 2023-10-12 15:19:22 | 查看全部
不用登录,就抓取动态加载之后能看得到数据就可以了
我要说一句 收起回复
CrystαlLv.8 发表于 2023-10-12 15:19:57 | 查看全部
不懂帮顶
我要说一句 收起回复
浅生Lv.8 发表于 2023-10-12 15:20:45 | 查看全部
不是有API调用接口吗...
我要说一句 收起回复
独家记忆Lv.8 发表于 2023-10-12 15:21:28 | 查看全部
不懂,楼下来说说
我要说一句 收起回复
独家记忆Lv.8 发表于 2023-10-12 15:21:43 | 查看全部
API需要钱,我想免费抓取几个数据就可以了
我要说一句 收起回复
拾光Lv.8 发表于 2023-10-12 15:22:15 | 查看全部
来看看高手是怎么弄的
我要说一句 收起回复
浅生Lv.8 发表于 2023-10-12 15:22:57 | 查看全部
来看看大佬是的答案
我要说一句 收起回复
TyCodingLv.8 发表于 2023-10-12 15:23:11 | 查看全部
路过,帮顶
我要说一句 收起回复
浅生Lv.8 发表于 2023-10-12 15:23:25 | 查看全部
import requests
from lxml import etree

url = 'https://www.aizhan.com/cha/baidu.com/'
headers = {
    "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36 Edg/115.0.1901.200',
}
res = requests.get(url, headers=headers)
html = etree.HTML(res.text)
pcWords = html.xpath('//*[@id="cc1"]/text()')
wapWords = html.xpath('//*[@id="cc2"]/text()')
shoulu3_1days = html.xpath('//*[@id="shoulu3_1days"]/text()')
shoulu3_7days = html.xpath('//*[@id="shoulu3_7days"]/text()')
shoulu3_30days = html.xpath('//*[@id="shoulu3_30days"]/text()')
print('PC词数:' + pcWords[0])
print('wap词数:' + wapWords[0])
print('24词数:' + shoulu3_1days[0])
print('7天词数:' + shoulu3_7days[0])
print('30天词数:' + shoulu3_30days[0])
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

创宇盾启航版免费网站防御网站加速服务
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:3.21.21.5,GMT+8, 2024-11-9 05:48 , Processed in 0.230519 second(s), 122 queries , Gzip On, Redis On.

Powered by Discuz! X5.0 Licensed

© 2001-2024 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表