Python3使用urllib爬取简单页面

2025-05-08 10:36:07

1、打开Python开发工具IDLE,新建‘url.py’文件,编写代码如下:from urllib.request import urlopenresp = urlopen('http://www.baidu.com')print (resp.read())

Python3使用urllib爬取简单页面

2、F5运行程序,获取到百度的首页的页面,打印源代码到Shell

Python3使用urllib爬取简单页面

3、改写代码,打印百度返回状态码from urllib.request import urlopenresp = urlopen('http://www.baidu.com')print (resp.getcode())

Python3使用urllib爬取简单页面

4、F5运行程序,打印出请求返回状态码200200 代表正常500 服务器出错400 请求参数异常

Python3使用urllib爬取简单页面

5、改写代码,打印请求url地址from urllib.request import urlopenresp = urlopen('稆糨孝汶;http://www.baidu.com')print (resp.getcode())print (resp.geturl())

Python3使用urllib爬取简单页面

6、F5运行程序,打印出发起访问百度url

Python3使用urllib爬取简单页面

7、改写代码,打印返回头部信息from urllib.request import ur盟敢势袂lopenresp = urlopen烫喇霰嘴('http://www.baidu.com')print (resp.getcode())print (resp.geturl())print (resp.info())

Python3使用urllib爬取简单页面

8、F5运行程序,打印出返回头部信息

Python3使用urllib爬取简单页面
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
相关推荐
  • 阅读量:27
  • 阅读量:71
  • 阅读量:89
  • 阅读量:73
  • 阅读量:74
  • 猜你喜欢