python解析xml

这篇文章距离上次修改已过532天，其中的内容可能已经有所变动。

在Python中，我们可以使用许多库来解析XML，包括内置库和第三方库。下面是几种不同的实现方法：

内置库xml.etree.ElementTree：




import xml.etree.ElementTree as ET
 
tree = ET.parse('file.xml')
root = tree.getroot()
 
# 遍历所有元素
for elem in root.iter():
    # 打印元素名称和文本内容
    print(elem.tag, elem.text)
 
# 根据元素路径查找特定元素
for elem in root.iter('element_name'):
    # 处理找到的元素
    pass

内置库xml.dom.minidom：




import xml.dom.minidom
 
dom = xml.dom.minidom.parse('file.xml')
 
# 获取根元素
root = dom.documentElement
 
# 遍历所有元素
elements = root.getElementsByTagName('*')
for elem in elements:
    # 打印元素名称和文本内容
    print(elem.tagName, elem.firstChild.nodeValue)
 
# 根据元素路径查找特定元素
elements = root.getElementsByTagName('element_name')
for elem in elements:
    # 处理找到的元素
    pass

第三方库xmltodict（需使用pip安装）：




import xmltodict
 
with open('file.xml') as f:
    xml_data = f.read()
 
data_dict = xmltodict.parse(xml_data)
 
# 遍历所有元素
def traverse(element):
    for key, value in element.items():
        if isinstance(value, dict):
            traverse(value)
        else:
            # 打印元素名称和文本内容
            print(key, value)
 
traverse(data_dict)
 
# 根据元素路径查找特定元素
def find_elements(element, target_name):
    if isinstance(element, dict):
        for key, value in element.items():
            if key == target_name:
                # 处理找到的元素
                pass
            else:
                find_elements(value, target_name)
        
find_elements(data_dict, 'element_name')

请注意，以上提供的是最常用的几种解析XML的方法，还有其他方法，比如基于SAX（Simple API for XML）的解析器和BeautifulSoup库等。选择使用哪种方法，取决于具体的需求和个人的喜好。

评论已关闭

推荐阅读