如何统计html标签的数目 python

2025-10-19 10:53:55

1、准备一个要统计的html文件,将其与py代码放在同一目录中

2、编写代码:

import re

 

with open('index.html','r',encoding='utf-8') as f:

 

   htmlstr = f.read()      # 打开html文件,并将内容放入htmstr变量

 

elements_lists = re.findall('<[^/].*?>',htmlstr)    # 利用正则表达式,查找所有不是以/开头的<>

 

print(len(elements_lists))      # 打印其长度

 

print(len(list(set(elements_lists))))   # 去重后打印长度

3、上述代码的缺点是:如果正文中有<内容>这样的情况,那也会一并被统计。

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢