我有Javascript puppeteer
代码和PuppeteerSharp for C#
。我知道这个图书馆很相似,而且我知道他们的网站。
但是我的问题是我几乎无法管理这个库,每个库都有很多方法,而且即使我有用JS编写的有效示例也很难找到所需的方法。
请帮助我将JS代码重写为C#,所以它会执行类似的操作。或者至少是函数名称,例如JS(puppeteer)方法= C#(puppeteerSharp)方法。
(async function main() {
try {
const browser = await puppeteer.launch();
const [page] = await browser.pages();
page.setDefaultTimeout(0);
await page.goto('www.example.com');
await page.waitForSelector('#search-content button.btn-icon');
let count = 0;
while (await page.$('#search-content button.btn-icon') !== null && count != 1) {
const articlesForNow = (await page.$$('#search-content article')).length;
console.log(`Articles for now: ${articlesForNow}. Getting more...`);
count += 1;
await Promise.all([
page.evaluate(
() => {
document.querySelector('#search-content button.btn-icon').click();
}
),
page.waitForFunction(
old => document.querySelectorAll('#search-content article').length > old, {},
articlesForNow
),
]);
}
const articlesAll = (await page.$$('#search-content article')).length;
console.log(`All articles: ${articlesAll}.`);
fs.writeFileSync('full.html', await page.content());
fs.writeFileSync('articles.html', await page.evaluate(
() => document.querySelector('#search-content div.b-filter__inner').outerHTML
));
fs.appendFileSync('articles.txt', await page.evaluate(
(fr) => {
let items = document.querySelectorAll(".product__body");
let appartmentsData = "";
for (let i = 0; i < items.length; i++) {
let itemLink = items[i].querySelector(".product__link").href;
let itemName = items[i].querySelector(".product__link strong").innerHTML;
let itemPrice = items[i].querySelector(".product__value").innerHTML;
return appartmentsData;
}, fr
));
// rest of the code
我到目前为止所拥有的:
using(var browser = await Puppeteer.LaunchAsync(new LaunchOptions())) {
var page = await browser.NewPageAsync();
await page.GoToAsync(LINK);
await page.WaitForSelectorAsync("#search-content button.btn-icon");
while (await page.QuerySelectorAsync("#search-content button.btn-icon") != null) {
var articlesForNow = await page.QuerySelectorAllAsync("#search-content article");
Console.WriteLine("Items proceed: " + articlesForNow.Length);
for (int i = 0; i < articlesForNow.Length; i++) {
string itemOuterHtml = await articlesForNow[i].EvaluateFunctionAsync < string > ("e => e.outerHTML");
}
await page.WaitForSelectorAsync("#search-content button.btn-icon").EvaluateFunctionAsync("e => e.click()");
}
}
但是它是无穷大,并且不会停止。元素为1275之后,它将在while循环中引发有关我的方法的错误。
PuppeteerSharp.WaitTaskTimeoutException: waiting for selector '#search-content button.btn-icon' failed: timeout 30000ms exceeded
答案 0 :(得分:1)
我们无法为您转换整个代码,但是这里有一些指针。您需要一次解决一个问题。
让我们研究一下JS代码,
let count = 0;
while (await page.$('#search-content button.btn-icon') !== null && count != 1) {}
它正在创建一会儿外观,如果count为1则停止。
现在输入您的C#代码,
while (await page.QuerySelectorAsync("#search-content button.btn-icon") != null)
它不是在检查计数,最终会在无限的while循环中结束。
您应该算数,
int count = 0;
while (await page.QuerySelectorAsync("#search-content button.btn-icon") != null && count != 1){
// other code
count++;
}
这样,它将在找到一个结果后停止。
您剩下的问题是关于Promise.all和其他一些东西。这是一些有用的链接,