如何用python写爬虫
1、创建项目


2、安装requests模块



3、模块安装成功


4、创建py文件


5、编写爬虫代码

6、编辑界面右键菜单中选择Run 'Spider'

7、运行结束,输出“baidu.html is got!!”,文件夹中得到一个新文件“baidu.html”

8、使用浏览器打开本地文件“baidu.html”

9、打开文件后发现页面中存在乱码

10、修改代码,修改请求到的响应的编码格式

11、再次运行代码,打开重新得到的“baidu.html”,乱码消失,爬取到的页面正常

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:83
阅读量:42
阅读量:62
阅读量:21
阅读量:44