Java 爬虫 jvppeteer
jvppeteer 是一个由 Java 编写的 Headless Chrome 工具,它可以模拟人的行为来进行网页爬取。以下是一个使用 jvppeteer 的简单示例:
import com.github.jvppeteer.core.Puppeteer;
import com.github.jvppeteer.core.browser.Browser;
import com.github.jvppeteer.core.page.Page;
public class JvppeteerExample {
public static void main(String[] args) {
// 启动浏览器
try (Browser browser = Puppeteer.launch()) {
// 打开一个新页面
Page page = browser.newPage();
// 导航到页面
page.goTo("https://example.com");
// 获取页面的标题
String title = page.title();
// 打印标题
System.out.println(title);
} catch (Exception e) {
e.printStackTrace();
}
}
}
在这个例子中,我们首先使用 Puppeteer.launch()
启动了一个浏览器实例。然后,我们通过 browser.newPage()
创建了一个新的页面实例,并通过 page.goTo()
方法导航到了指定的 URL。最后,我们通过 page.title()
获取了页面的标题并打印了出来。
请注意,jvppeteer 依赖于正确配置的 Headless Chrome 和相应的浏览器环境。此外,jvppeteer 在更新较快,API 可能随时间变化,因此请参考最新的官方文档。
评论已关闭