阅读背景：

python 爬取网站图片

发表于:2021-11-20

爬取图片方法一: requests

#!/usr/bin/python2.7 
# -*- coding: utf-8 -*-
import re
import requests
import os
import shutil

suyan_url= 'https://www.xiaohuar.com/s-1-2069.html'

response  = requests.get(suyan_url)
# print(response.content)

lists = re.findall(r'href="/go.html?url=(?:.*?)".*?class="(?:.*?)"',response.text,re.S)  #re.S 把文本信息转换成1行匹配

folder = 'aabb'
if os.path.exists(folder):
        shutil.rmtree(folder)
os.mkdir(folder);
os.chdir(folder);

for each in lists:
    imgurl = each.split(' ')[0][6:-1]
    if imgurl[-4:] == '.jpg':
        filename = imgurl.split('/')[-1]
        img  = requests.get(imgurl)
        with open(filename,'wb') as f:
            f.write(img.content)#!/usr/bin/python2.7

分享到：

非常感谢你花费了来阅读本文,如果你在本站获取到了新知识,那就请点击分享按钮将本站分享出去吧。

你可能喜欢:

STM32CubeMx开发之路—12使用ADC和DAC

WPF TabControl - 无法以编程方式选择选项卡

云计算基础：云基础设施机制包括哪些主要构件？云存储设备的存储等级和使用的主要存储接口

Exchange 2003 反垃圾邮件

可视化的Redis数据库管理工具redis-desktop-manager的初步使用（图文详解）

关于servlet中的数据如何返回问题。

把txt文件转换为tsv文件的python脚本

受益技术类书籍

从Android Studio gradle build访问环境变量

spi-flash烧写擦除都没有效果

相关阅读:

禁止滑动的ViewPager

探秘Kubernetes：在本地环境中玩转容器技术

关于App程序员泡沫

火山引擎ByteHouse：如何为OLAP设计高性能向量检索能力？

云计算 - 以阿里云为例，企业上云策略全览与最佳实践

使用Kotlin开发Android应用（III）：扩展函数和默认值

我的第一本著作：Spark技术内幕上市！

strtotime("0000-00-00 00:00:00") 的大“坑”

拓数派加入 OpenCloudOS 操作系统开源社区，作为成员单位参与社区共建

探秘Kubernetes：在本地环境中玩转容器技术

随便看看:

mysql 选择插入数据(包含不存在列)具体实现

Android Bitmap那些事之如何优化内存

mycat 读写分离+分库分表+全局表

ReactJS - 00 - 我由Angular转向React，为什么？

Content Editor Webpart（二）添加JQuery和html代码

spring(一)--spring/springmvc/spring+hibernate(mybatis)配置文件

2023 龙蜥操作系统大会演讲实录：《兼容龙蜥的云原生大模型数据计算系统——πDataCS》

Node.js模块加载详解

文本框获得焦点和失去焦点的判断代码

PHP的一个基础知识表单提交