提高学习python动力,爬取妹子图。如果这也没动力那就没救了。
爬虫成果
当你运行代码后,文件夹就会越来越多,如果爬完的话会有特别多个文件夹,特别多张图片。不过会很耗时间,可以在最后的代码设置爬取页码范围。
本文目标
1. 熟悉 Requests 库,Beautiful Soup 库
2. 熟悉多线程爬取
3. 送福利,妹子图
网站结构
我们从 https://www.lnlnl.cn/meizitu/1/ 这个链接进去,可以看到是一组一组的套图,点击任何一组图片会进入到详情界面,可以看到图片是依次排开的,知乎上有人贴出的代码只能爬取第一页的图片,我在这里优化了下,可以循环爬取分页页面的图片。(要看就看全部-:))
实现思路
1. 构造 url 链接,去请求图一所示的套图列表界面,拿到每一个页面中的套图列表。
2. 分别进入每个套图中去,下载相应的图片。
GitHub 地址:
https://github.com/news221/Python/blob/main/2-妹子图.py
获取到图片示例
2020年11月10日 下午9:50 沙发
博主,补充营养快线了
2020年11月28日 下午8:18 地下1层
@楚狂人 营养跟不上了