首页 > C#, 日常 > 无头浏览器 PuppeteerSharp

无头浏览器 PuppeteerSharp

在研究无头浏览器的时候,发现了一些不错的工具,例如 phantomjs 就可以让你以前端 js 脚本的方式来操作页面,以满足一些自动化测试方面的需求。后来又发现了 puppeteer,有很多开发语言的实现。

而今天提及的 PuppeteerSharp 就是 .Net 的实现。可能我执念太深,总觉得 Net 是相当不错的选择。

PuppeteerSharp 是一个控制无头Chrome 浏览器的库,它允许开发者通过编程方式模拟浏览器行为,执行网页操作,截取网页截图,获取网页内容,可以把网页转换成PDF等等。

截图

using var browserFetcher = new BrowserFetcher();
await browserFetcher.DownloadAsync();
await using var browser = await Puppeteer.LaunchAsync(
new LaunchOptions { Headless = true });
await using var page = await browser.NewPageAsync();
await page.GoToAsync("http://www.google.com");
await page.ScreenshotAsync(outputFile);

也支持设置页面的尺寸

await Page.SetViewportAsync(new ViewPortOptions
{
Width = 500,
Height = 500
});

生成 pdf 文件

using var browserFetcher = new BrowserFetcher();
await browserFetcher.DownloadAsync();
await using var browser = await Puppeteer.LaunchAsync(new LaunchOptions {Headless = true});
await using var page = await browser.NewPageAsync();
await page.GoToAsync("http://www.google.com"); // In case of fonts being loaded from a CDN, use WaitUntilNavigation.Networkidle0 as a second param.
await page.EvaluateExpressionHandleAsync("document.fonts.ready"); // Wait for fonts to be loaded. Omitting this might result in no text rendered in pdf.
await page.PdfAsync(outputFile);

动态注入 html 元素

await using var page = await browser.NewPageAsync();
await page.SetContentAsync("My Receipt");
var result = await page.GetContentAsync();

执行脚本

await using var page = await browser.NewPageAsync();
var seven = await page.EvaluateExpressionAsync("4 + 3");
var someObject = await page.EvaluateFunctionAsync("(value) => ({a: value})", 5);
Console.WriteLine(someObject.a);

等待某个选择器

using (var page = await browser.NewPageAsync())
{
await page.GoToAsync("https://www.baidu.com");
await page.WaitForSelectorAsync("div.main-content")
await page.PdfAsync(outputFile));
}

等待函数的执行

using (var page = await browser.NewPageAsync())
{
await page.GoToAsync("https://www.baidu.com");
var watchDog = page.WaitForFunctionAsync("()=> window.innerWidth < 100");
await page.SetViewportAsync(new ViewPortOptions { Width = 50, Height = 50 });
await watchDog;
}


分类: C#, 日常 标签:
  1. 本文目前尚无任何评论.
  1. 本文目前尚无任何 trackbacks 和 pingbacks.