阅读背景:

Python爬虫_案例分析(二)

来源:互联网 
Python爬虫_案例分析(二) 一、电影天堂案例 import scrapy from scrapy_movie.items import ScrapyMovieItem class MvSpider(scrapy.Spider): name = 'mv' allowed_domains = ['www.dytt8.net'] start_urls = ['https://www.dytt8.net/html/gndy/china/index.html'] def parse(self, response): # 第一页的名字和第二页的图片 a_list= response.xpath('//div[@class="co_content8"]//td[2]//a[2]') for a in a_list: # 获取第一页的name和要点击的链接 name = a.xpath('./text()').extract_first() href = a.xpath('./@href').extract_first() # 第二页的地址是 url = 'https://www.dytt8.net' + href # 对第二页的链接发起访问 yield scrapy.Request(url=url,callback=self.parse_second,meta = { 'name':name}) def parse_second(self,response): # 如果拿不到数据,务必检查xpath的路径是否正确 src = response.xpath('//div[@id="Zoom"]//img/@src').extract_first() # 接收到请求的meta参数的值 name = response.meta['name'] movie = ScrapyMovieItem(src = src,name = name) yield movie Python爬虫_案例分析(二) 一、电影天堂案例 import scrapy from scra



你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: