阅读背景：

课堂笔记-用python爬虫文档

发表于:2022-01-23

今天课堂笔记

from urllib import request
import re


url="https://www.kgc.cn/coding/"
for i in range(1,25):                                  #把抓取到的页面存到本机，从页面得知总共25页
    fname='list-{0}-6-9-9-0.shtml'.format(i)
    response=request.urlopen(url+fname)
    print('开始保存：{}'.format(fname))
    f=open(fname,'w+',encoding='utf-8')
    f.writelines(response.read().decode("utf-8"))
    f.close()

for i in range(1,25):                                #解析
    fname='list-{0}-6-9-9-0.shtml'.format(i)       
    f=open(fname,'r',encoding='UTF-8')
    f2=open('data-{0}.txt'.format(i),'w+',encoding='utf-8')
    htmlStr=f.read()
    p=r'<a href="/go.html?url=.+" class="yui3-u course-title-a" target="_blank" alt=".+">(.+)</a>'
    p2=r'<span class="course-pepo">(\d+)</span>'
    p3=r'<span class="view0-old">(.+)</span>'
    rs1=re.findall(p,htmlStr,re.I|re.M)
    rs2=re.findall(p2,htmlStr,re.I|re.M)
    rs3=re.findall(p3,htmlStr,re.I|re.M)

    for n in range(len(rs1)):                                      #把解析结果写入档案
        f2.write("{0} {1} {2}".format(rs1[n],rs2[n],rs3[n]))
        f2.write('\n')
    f2.close()
    f.close()from urllib import request
impor

分享到：

非常感谢你花费了来阅读本文,如果你在本站获取到了新知识,那就请点击分享按钮将本站分享出去吧。

你可能喜欢:

DATAGRID中的EDITITEMTEMPLATE问题，无经验者难答

大神告诉你：Java开发必备三项技能

Android绘制空心矩形示例

Silverlight 后台设置 button 纯色背景

OpenCV Using Python——RGB颜色空间中的肤色检测

一个测试文件与源文件位于不同模块时Jacoco覆盖率配置的例子

Android 分析监听器上的参数position和id_那年的专栏

一副牌54张，除去大小王，52张，抽出40张，计算最大积分

Linux流量控制工具TC_onephone的专栏_linux打流工具

如何向SimpleMDE添加自定义Markdown功能？

相关阅读:

一步一步教你搭建基于docker的MongoDB复制集群环境

火山引擎ByteHouse：如何为OLAP设计高性能向量检索能力？

Android Edittext 显示光标获取焦点监听焦点

计算机网络（版本2） [0x00][0x00] 常用概念

OpenTofu路在何方：定量分析Terraform issue数据，洞察用户需求｜OpenTofu Day 闪电演讲

Walrus 入门教程：如何创建模板以沉淀可复用的团队最佳实践

Android中不同方向嵌套滑动的解决方案（ListView为例子）

Docker技术全景：推动云原生架构的关键力量

MapReduce程序之实现单表关联

永远不要小瞧任何一个人

随便看看:

PieCloudDB Database 自研内存管理器 ASanAlloc：为产品质量保驾护航

Linux之实现Apache服务器监控、数据库定时备份及通过使用Shell脚本发送邮件

\u4e00是什么字符

使用Kotlin开发Android应用（III）：扩展函数和默认值

CentOS-7磁盘扩容之殇

【Qt】：常用控件（五：显示类控件）

通过编排管理 Docker 容器

AWS Security Token Service

介绍一些PHP判断变量的函数

Window部署Oracle并实现公网环境远程访问本地数据库