Java程序中使用 Jsoup 爬虫( 简单示例 )

作者：System 时间：2024年08月23日分类：所有,爬虫字数：794

这篇文章距离上次修改已过690天，其中的内容可能已经有所变动。




import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
 
public class SimpleJsoupExample {
    public static void main(String[] args) {
        String url = "http://example.com"; // 替换为你想爬取的网站
        try {
            Document doc = Jsoup.connect(url).get();
            Elements elements = doc.select("title"); // 选择所有的标题元素
            if (elements.size() > 0) {
                Element titleElement = elements.get(0);
                System.out.println("网页标题: " + titleElement.text());
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

这段代码使用Jsoup库连接到指定的URL，获取HTML文档，并使用选择器选择页面中的<title>元素。然后，它打印出获取到的标题文本。这是一个简单的Jsoup使用例子，展示了如何开始使用这个库进行网页爬取。

Java程序中使用 Jsoup 爬虫( 简单示例 )

评论已关闭

推荐阅读