使用 XPath 定位 HTML 中的 img 标签
在HTML中使用XPath定位img
标签,可以使用以下XPath表达式:
//img
这个表达式会选择所有的img
标签。如果你想要选择特定属性的img
标签,比如src
属性为image.jpg
的img
标签,可以使用:
//img[@src='image.jpg']
如果你想要选择某个特定类(class
)的img
标签,比如class
为image-class
的img
标签,可以使用:
//img[@class='image-class']
以下是一个使用Python和lxml
库来获取HTML中img
标签的简单示例:
from lxml import etree
html = """
<html>
<body>
<img src="image1.jpg" class="image-class">
<img src="image2.jpg">
</body>
</html>
"""
tree = etree.HTML(html)
img_tags = tree.xpath('//img')
for img in img_tags:
print(img.attrib) # 打印所有属性
print(img.attrib['src']) # 打印src属性
这段代码会打印出所有img
标签的属性和它们的src
属性值。
评论已关闭