爬虫-BeautifulSoup之XML篇

作者：System 时间：2024年08月17日分类：所有,爬虫字数：821

这篇文章距离上次修改已过709天，其中的内容可能已经有所变动。




from bs4 import BeautifulSoup
import requests
 
# 示例XML内容
example_xml = """
<books>
    <book>
        <name>Python爬虫开发与项目实战</name>
        <author>李华</author>
        <price>128.00</price>
    </book>
    <book>
        <name>JavaScript网络爬虫</name>
        <author>王明</author>
        <price>89.00</price>
    </book>
</books>
"""
 
# 解析XML内容
soup = BeautifulSoup(example_xml, 'xml')
 
# 查找所有的<book>标签
books = soup.find_all('book')
 
# 遍历并打印每本书的信息
for book in books:
    name = book.name.text
    author = book.author.text
    price = book.price.text
    print(f"书名：{name}, 作者：{author}, 价格：{price}")

这段代码首先导入了必要的BeautifulSoup和requests模块，然后定义了一个示例XML字符串。接着使用BeautifulSoup解析这个XML字符串，并设置解析器为'xml'。之后，它查找所有的'book'标签，并遍历它们，提取出每本书的名称、作者和价格，最后打印这些信息。这个例子展示了如何使用BeautifulSoup来解析XML数据，并提取出需要的信息。

爬虫-BeautifulSoup之XML篇

评论已关闭

推荐阅读