我正在用selenium抓一个网页。
这是代码:
IWebElement divlink = driver.FindElement(By.XPath("/html/body/div[5]/div/div/ul[2]/li/div[1]"));
//Console.WriteLine(divlink.GetAttribute("innerHTML"));
postcontent = divlink.GetAttribute("innerHTML");
postcontent = postcontent.Replace("'", "''");
我有下一个问题:
为每<br>
添加<br />
,并在4行跳转中产生...
我尝试更换:postcontent = postcontent.Replace("<br />", "");
但没有结果......
原始HTML显示:
Podríamos exponer aquí nuestras experiencias con la compra de productos en tiendas on-line, para así saber cual es la que más compensa.<br />
<br />
Lista de tiendas on-line:<br />
<br />
<a rel="nofollow" href="http://asetech.dvdadvdr.net" target="_blank">ddd</a> CD's, DVD's y grabadoras. Cumplen bien.<br />
<br />
Scraped HTML显示:
Podríamos exponer aquí nuestras experiencias con la compra de productos en tiendas on-line, para así saber cual es la que más compensa.<br><br />
<br><br />
Lista de tiendas on-line:<br><br />
<br><br />
<a rel="nofollow" href="http://asetech.dvdadvdr.net" target="_blank">ddd</a> CD's, DVD's y grabadoras. Cumplen bien.<br><br />
<br><br />