• 2022-03-15
    那么今天,我们就正式开始我们的第一篇实战内容,爬取一整个淘宝店铺里的所有宝贝的详情页,并且把详情页里的宝贝图片保存下来。爬虫框架我一直是使用Scrapy的,在用Scrapy抓取店铺信息的时候,因为淘宝的反爬机制,发现了机器人,所以获取不到任何信息,当时我赶着用宝贝图片,所以我使用了之前介绍的selenium来获取网页信息,并且通过我们上一篇介绍的lxml框架来提取信息。