Python Beautiful Soup类的基本元素

网友投稿 662 2022-11-20

Python Beautiful Soup类的基本元素

Python Beautiful Soup类的基本元素

Beautiful Soup库是解析,遍历,维护“标签树”的功能库。 条件: pip install lxml pip install html5lib

以下5种基本元素是使用方法! Tag:标签,最基本的信息组织单元,分别用<>和标明开头和结尾

提前要写的代码

import requestsr = requests.get("= r.textfrom bs4 import BeautifulSoupsoup = BeautifulSoup(demo , "html.parser")print(soup.prettify())

执行结果:(比例不对就用放大镜查看!)

做汤:

可以查看标题!

Name:标签的名字,

...

的名字是'p',格式:.name

(比例不对就用放大镜查看!)

获取标签名字:

它父亲的名字,就是上一层的:

其父亲的上一层的名字:

Attributes:标签的属性,字典的形式组织,格式:.attrs

说明标签特点:

有一个字典。

上图为字典属性值。

上图为连接属性值。

标签属性类型:

为字典类型。

tag标签属性:

NavigableString:标签内非属性字符串,<>...中字符串,格式:.string

a标签的字符串信息:

p标签:

p标签的字符串信息:

Comment:标签内字符串的注释部分,一种特殊的Comment类型

处理注释部分:

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:SpringBoot AOP @Pointcut切入点表达式排除某些类方式
下一篇:Python网络爬虫之制作股票数据定向爬虫 以及爬取的优化 可以显示进度条!
相关文章

 发表评论

暂时没有评论,来抢沙发吧~