从JS Puppeteer代码更改为PuppeteerSharp C#

时间:2019-04-04 17:48:25

标签: javascript c# puppeteer puppeteer-sharp

我有Javascript puppeteer代码和PuppeteerSharp for C#。我知道这个图书馆很相似,而且我知道他们的网站。

但是我的问题是我几乎无法管理这个库,每个库都有很多方法,而且即使我有用JS编写的有效示例也很难找到所需的方法。

请帮助我将JS代码重写为C#,所以它会执行类似的操作。或者至少是函数名称,例如JS(puppeteer)方法= C#(puppeteerSharp)方法。

(async function main() {
      try {
        const browser = await puppeteer.launch();
        const [page] = await browser.pages();
        page.setDefaultTimeout(0);

        await page.goto('www.example.com');

        await page.waitForSelector('#search-content button.btn-icon');
        let count = 0;
        while (await page.$('#search-content button.btn-icon') !== null && count != 1) {
          const articlesForNow = (await page.$$('#search-content article')).length;
          console.log(`Articles for now: ${articlesForNow}. Getting more...`);
          count += 1;
          await Promise.all([
            page.evaluate(
              () => {
                document.querySelector('#search-content button.btn-icon').click();
              }
            ),
            page.waitForFunction(
              old => document.querySelectorAll('#search-content article').length > old, {},
              articlesForNow
            ),
          ]);
        }

        const articlesAll = (await page.$$('#search-content article')).length;
        console.log(`All articles: ${articlesAll}.`);

        fs.writeFileSync('full.html', await page.content());

        fs.writeFileSync('articles.html', await page.evaluate(
          () => document.querySelector('#search-content div.b-filter__inner').outerHTML
        ));

        fs.appendFileSync('articles.txt', await page.evaluate(
              (fr) => {
                let items = document.querySelectorAll(".product__body");
                let appartmentsData = "";

                for (let i = 0; i < items.length; i++) {
                  let itemLink = items[i].querySelector(".product__link").href;
                  let itemName = items[i].querySelector(".product__link strong").innerHTML;
                  let itemPrice = items[i].querySelector(".product__value").innerHTML;

                  return appartmentsData;
                }, fr
              ));
              // rest of the code

我到目前为止所拥有的:

using(var browser = await Puppeteer.LaunchAsync(new LaunchOptions())) {
 var page = await browser.NewPageAsync();
 await page.GoToAsync(LINK);
 await page.WaitForSelectorAsync("#search-content button.btn-icon");

 while (await page.QuerySelectorAsync("#search-content button.btn-icon") != null) {
  var articlesForNow = await page.QuerySelectorAllAsync("#search-content article");

  Console.WriteLine("Items proceed: " + articlesForNow.Length);

  for (int i = 0; i < articlesForNow.Length; i++) {
   string itemOuterHtml = await articlesForNow[i].EvaluateFunctionAsync < string > ("e => e.outerHTML");
  }

  await page.WaitForSelectorAsync("#search-content button.btn-icon").EvaluateFunctionAsync("e => e.click()");
 }
}

但是它是无穷大,并且不会停止。元素为1275之后,它将在while循环中引发有关我的方法的错误。

PuppeteerSharp.WaitTaskTimeoutException: waiting for selector '#search-content button.btn-icon' failed: timeout 30000ms exceeded

1 个答案:

答案 0 :(得分:1)

我们无法为您转换整个代码,但是这里有一些指针。您需要一次解决一个问题。

中断while循环

让我们研究一下JS代码,

let count = 0;
while (await page.$('#search-content button.btn-icon') !== null && count != 1) {}

它正在创建一会儿外观,如果count为1则停止。

现在输入您的C#代码,

while (await page.QuerySelectorAsync("#search-content button.btn-icon") != null)

它不是在检查计数,最终会在无限的while循环中结束。

您应该算数,

int count = 0;
while (await page.QuerySelectorAsync("#search-content button.btn-icon") != null && count != 1){
 // other code
 count++;
}

这样,它将在找到一个结果后停止。

了解有关Promise.all等的更多信息。

您剩下的问题是关于Promise.all和其他一些东西。这是一些有用的链接,