Java程序中使用 Jsoup 爬虫( 简单示例 )
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class SimpleJsoupExample {
public static void main(String[] args) {
String url = "http://example.com"; // 替换为你想爬取的网站
try {
Document doc = Jsoup.connect(url).get();
Elements elements = doc.select("title"); // 选择所有的标题元素
if (elements.size() > 0) {
Element titleElement = elements.get(0);
System.out.println("网页标题: " + titleElement.text());
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
这段代码使用Jsoup库连接到指定的URL,获取HTML文档,并使用选择器选择页面中的<title>
元素。然后,它打印出获取到的标题文本。这是一个简单的Jsoup使用例子,展示了如何开始使用这个库进行网页爬取。
评论已关闭