使用 XPath 定位 HTML 中的 img 标签
warning:
这篇文章距离上次修改已过439天,其中的内容可能已经有所变动。
在HTML中使用XPath定位img标签,可以使用以下XPath表达式:
//img这个表达式会选择所有的img标签。如果你想要选择特定属性的img标签,比如src属性为image.jpg的img标签,可以使用:
//img[@src='image.jpg']如果你想要选择某个特定类(class)的img标签,比如class为image-class的img标签,可以使用:
//img[@class='image-class']以下是一个使用Python和lxml库来获取HTML中img标签的简单示例:
from lxml import etree
html = """
<html>
<body>
<img src="image1.jpg" class="image-class">
<img src="image2.jpg">
</body>
</html>
"""
tree = etree.HTML(html)
img_tags = tree.xpath('//img')
for img in img_tags:
print(img.attrib) # 打印所有属性
print(img.attrib['src']) # 打印src属性这段代码会打印出所有img标签的属性和它们的src属性值。
评论已关闭