·设为首页收藏本站📧邮箱修改🎁免费下载专区💎积分✅卡密📒收藏夹👽聊天室
返回列表 发布新帖

大佬帮忙测试一下,手上没有python环境

221 2

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
以下是一个简单的Python程序,可以从指定的小说网站中采集小说内容,并将其导出为TXT格式文件。

import requests
from bs4 import BeautifulSoup

# 设置请求头,模拟浏览器访问
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}

# 输入小说的URL地址
novel_url = input("请输入小说的URL地址:")

# 发送请求,获取小说的HTML页面
response = requests.get(novel_url, headers=headers)
html = response.text

# 使用BeautifulSoup解析HTML页面
soup = BeautifulSoup(html, 'html.parser')

# 获取小说的标题和作者
title = soup.find('h1').text.strip()
author = soup.find('div', class_='author').text.strip()

# 创建TXT文件,保存小说内容
with open(title + '.txt', 'w', encoding='utf-8') as f:
    f.write(title + '\n\n')
    f.write('作者:' + author + '\n\n')

    # 获取小说的章节列表
    chapter_list = soup.find('div', class_='list').find_all('a')

    # 遍历章节列表,获取每个章节的内容
    for chapter in chapter_list:
        chapter_url = chapter['href']
        chapter_title = chapter.text.strip()

        # 发送请求,获取章节的HTML页面
        response = requests.get(chapter_url, headers=headers)
        html = response.text

        # 使用BeautifulSoup解析HTML页面
        soup = BeautifulSoup(html, 'html.parser')

        # 获取章节的内容
        content = soup.find('div', class_='content').text.strip()

        # 将章节的标题和内容写入TXT文件
        f.write(chapter_title + '\n\n')
        f.write(content + '\n\n')
使用方法:

将以上代码复制到Python编辑器中,保存为novel_crawler.py文件。

运行novel_crawler.py文件。

在命令行中输入小说的URL地址,例如:https://www.xxxx.com/xxxxx.html。

程序会自动采集小说内容,并将其保存为TXT格式文件,文件名为小说的标题。
我要说一句 收起回复
创宇盾启航版免费网站防御网站加速服务

评论2

IT618发布Lv.8 发表于 2023-4-16 23:00:06 | 查看全部
没有一点用 代码基本没用通用一说 他这个标题 作者 内容获取都是写死的 还没做错误判断跑不下去的 就算跑下去了也很容易被封
我要说一句 收起回复
浅生Lv.8 发表于 2023-4-16 23:00:13 | 查看全部
好吧
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

图文热点
创宇盾启航版免费网站防御网站加速服务
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:18.118.227.199,GMT+8, 2024-11-22 07:34 , Processed in 0.416731 second(s), 91 queries , Gzip On, Redis On.

Powered by Discuz! X5.0 Licensed

© 2001-2024 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表