HTML内容爬取:使用Objective-C进行网页数据提取
#import "TBXML.h"
// 假设我们有一个TBXML元素指针`rootXMLElement`
TBXMLElement *rootXMLElement = ...; // 获取根元素的逻辑
// 遍历根元素下的所有子元素
for (TBXMLElement *element in [rootXMLElement children]) {
// 假设我们关心的元素名为"item"
if (strcmp([element name], "item") == 0) {
// 提取"item"元素的属性
for (TBXMLElement *attribute in [element attributes]) {
NSLog(@"%s: %s", [attribute name], [attribute value]);
}
// 提取"item"元素下的文本内容
TBXMLElement *textElement = [element firstChild];
if (textElement) {
NSLog(@"%s", [textElement text]);
}
}
}
这个代码示例展示了如何使用TBXML库来遍历XML文档中的元素和属性,并提取我们感兴趣的数据。在这个例子中,我们假设已经有一个指向XML文档根元素的rootXMLElement
,并且我们正在查找名为"item"的子元素。代码中的strcmp
用于安全地比较字符串(C风格),而NSLog
用于打印提取的数据。
评论已关闭