python爬取网站数据(程序小技巧)

爬取网页数据是python很长干的一件事情,不过做起来基本上都是很冗长的一段代码,看起来复杂,不宜理解。今天给大家分享一个小诀窍,利用python3中的requests类库进行爬取网页数据。我们先看一哈用这个requests类库做的效果本节分享技术知识点:python导入三方类库的学习requests类库的简单使用爬取网页数据一、爬取网页数据实现代码# -*- coding:UTF-8 -*-import requestsif __name__ == ‘__main__': target = ‘http://gitbook.cn/’ req = requests.get(url=target) print(req.text)这就是实现爬取网页数据的全部代码,简单易操作。python的魅力,就是用最少的代码做最多的事。二、创建一个python类,把上面的代码复制进去1、如创建一个叫 pachong的类,如下图(文件取名,随意)创建好以后,把上面第一步的代码复制进去,这时候会报红。要解决这个报红的问题则需要导入第三方类库。三、导入第三方类库1、其实导入三方类库也很简单,有下面两种方式。(此次讲解以mac为列)3.1.1、输入requests时按alt+回车键(Mac电脑)3.1.2、或者点击这个红色灯泡,然后install导入第三方类库如上面两种方式,我们便可以轻松的导入类库了。四、运行代码1、导入成功后,点击requests不在报红,则开始点击运行代码运行完后,就可以爬取到网页数据了,如下图所示。到这里我们就轻松的实现了网页数据的爬取,我们后面要做的就是使用正则表达式,从上图的数据中,过滤出自己需要的数据。

本文出自快速备案,转载时请注明出处及相应链接。

本文永久链接: https://kuaisubeian.cc/45114.html

kuaisubeian