Python爬取时如何判断HTML标签
1、首先我们打开编辑器,然后新建一个py后缀的文件,这是一个PYTHON的文件。

3、website = "网页"result = requests.get(website)result.encodi荏鱿胫协ng = "utf-8"content = result.textprint(content)这里我们就可以用requests这个库来先获取整个网页的HTML代码。并且打印一下查看是否有问题。

5、现在可以来判断和获取HTML标签了,HTML标签是由<></>这样的格式组成的。title_tag = soup.titleprint(title_tag像粜杵泳)print(title_tag.text)比如我们看到了title标签想获取,就可以指定名字即可,如果要里面的内容可以用text。

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:45
阅读量:35
阅读量:36
阅读量:25
阅读量:68