爬虫-BeautifulSoup之XML篇
from bs4 import BeautifulSoup
import requests
# 示例XML内容
example_xml = """
<books>
<book>
<name>Python爬虫开发与项目实战</name>
<author>李华</author>
<price>128.00</price>
</book>
<book>
<name>JavaScript网络爬虫</name>
<author>王明</author>
<price>89.00</price>
</book>
</books>
"""
# 解析XML内容
soup = BeautifulSoup(example_xml, 'xml')
# 查找所有的<book>标签
books = soup.find_all('book')
# 遍历并打印每本书的信息
for book in books:
name = book.name.text
author = book.author.text
price = book.price.text
print(f"书名:{name}, 作者:{author}, 价格:{price}")
这段代码首先导入了必要的BeautifulSoup和requests模块,然后定义了一个示例XML字符串。接着使用BeautifulSoup解析这个XML字符串,并设置解析器为'xml'。之后,它查找所有的'book'标签,并遍历它们,提取出每本书的名称、作者和价格,最后打印这些信息。这个例子展示了如何使用BeautifulSoup来解析XML数据,并提取出需要的信息。
评论已关闭