python爬取138看书网小说源码 v2.16

2024-04-09 中

python爬取138看书网小说源码由论坛用户制作并分享，适用于138小说网，能够帮助用户爬取网站获取小说资源，软件提供分类搜索查找的功能，支持目录爬取，还附带书签功能，用户使用这款软件能够更加轻松地看小说，非常实用。

记录一下今天爬的第二个小说网，第二次弄起来比较熟练了，不像第一次弄一半就得找教程边看边搞。

但实际上爬小说应该是最简单的事情了吧，涉及的技术也没有那么深。

把代码发出来让想刚入门却不知道从何下手的同萌新们看看吧，看教程总是云里雾里的，还是还得上手多练练才能加深印象。

这个小说爬虫还是有点垃圾，多线程没有，而且有些函数也是用的跟*一样，这玩意该怎么改进也没有头绪。

import requests

import lxml

import re

headers = {

'user-agent': 'User-AgentMozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'

}

print ('本脚本仅适用于138看书网：https://www.13800100.com/')

#url_list = 'https://www.13800100.com/list/72262/'

url_list = (input('粘贴小说目录url，必须是小说目录，小说首页不支持 '))

downurl = 'https://www.13800100.com/article/'

url_list = requests.get(url_list)

展开全部