@Arran解决了,硒不适用于 text()函数,更新xpath到:// table [@ width = 200] / tbody / tr [1] / td / a
我需要操纵一个内部系统,它永远不会准时到位
我更改了超时加载和脚本到30个小时,看到它真的是一个时间问题
我禁用了javascript
没有任何效果。
我创建了一个非常小的Selenium代码版本和一个我放在我的网络服务器上的简单html文件版本
当我在Chrome上打开并在控制台上键入$ x('// table [@ width = 200] / tbody / tr [1] / td / a / text()')时,xpath会得到我想要的内容。
但是当我在PhantomJSDriver上做同样的事情时,有一个neverendig过程(我知道超时设置为30小时)
当我与Fiddler比较时,内容是相同的
我不需要GPU,但是当我尝试使用ChromeDriver时,它会抛出一个与gpu相关的例外:
[4588:4592:0519/143844:错误:gpu_info_collector_win.cc(140)]无法从评估结果中读取游戏分数。
最小的html是:
<html>
<head>
<title>Its a test</title>
</head>
<body>
<table width=200>
<tbody>
<tr>
<td>
<a href='http://uej65ge.com/lnk001.html'>text01</a>
</td>
<td>
<a href='http://uej65ge.com/lnk002.html'>text02</a>
</td>
</tr>
<tr>
<td>
<a href='http://uej65ge.com/lnk003.html'>text03</a>
</td>
<td>
<a href='http://uej65ge.com/lnk004.html'>text04</a>
</td>
</tr>
</tbody>
</table>
</body>
</html>
WebDriver代码是:
// ------------------------------------------------ -
public void start() throws FileNotFoundException {
WebDriver driver;
driver = getPhanthomDriver();
scrapTest(driver);
}
// --------------------------------------------- ----
private WebDriver getPhanthomDriver() {
WebDriver driver = null;
try {
DesiredCapabilities caps = new DesiredCapabilities();
String pathToPhantom = ConfigProvider.getStringConfig("pathToPhantom");
caps.setCapability(PhantomJSDriverService.PHANTOMJS_EXECUTABLE_PATH_PROPERTY, pathToPhantom);
caps.setJavascriptEnabled(false);
driver = new PhantomJSDriver(caps);
} catch (IOException ex) {
ConsoleHelper.printMessage("ERRO_io:" + ex.getMessage(), new Date());
} catch (Exception ex) {
ConsoleHelper.printMessage("ERRO_ex:" + ex.getMessage(), new Date());
}
return driver;
}
// --------------------------------------------- ----
private WebDriver getChromeDriver() {
// [4588:4592:0519/143844:ERROR:gpu_info_collector_win.cc(140)] Could not read gaming score from assessment results.
// I dont need GPU here !!!
WebDriver driver = null;
try {
String pathToChrome = ConfigProvider.getStringConfig("pathToChrome");
System.setProperty("webdriver.chrome.driver", pathToChrome);
driver = new ChromeDriver();
} catch (Exception ex) {
ConsoleHelper.printMessage("ERRO_ex:" + ex.getMessage(), new Date());
}
return driver;
}
// --------------------------------------------- ----
public void scrapTest(WebDriver driver) throws FileNotFoundException {
// this its form more than 05 minutes without return
try {
long pollingForSecond = 1;
long timeOutInSeconds = 999999;
if(driver == null){ throw new Exception("Erro, driver informado era nulo");}
String initialUrl = "http://devw7lng:8080/CPS/xpts.html";
driver.manage().timeouts().pageLoadTimeout(30, TimeUnit.HOURS);
driver.manage().timeouts().setScriptTimeout(30, TimeUnit.HOURS);
driver.get(initialUrl);
final String xpath_categoriasTexto = "'//table[@width=200]/tbody/tr[1]/td/a/text()'";
List<WebElement> elements = null;
try {
Wait<WebDriver> wait = new FluentWait<WebDriver>(driver)
.withTimeout(timeOutInSeconds, TimeUnit.SECONDS)
.pollingEvery(pollingForSecond, TimeUnit.SECONDS)
.ignoring(NoSuchElementException.class)
.ignoring(org.apache.http.NoHttpResponseException.class);
elements = wait.until(new Function<WebDriver, List<WebElement>>() {
@Override
public List<WebElement> apply(WebDriver driver) {
System.out.print(".");
return driver.findElements(By.xpath(xpath_categoriasTexto));
}
});
} catch (Exception err) {
}
boolean ok = false;
ok = ((elements != null) && (elements.size() > 0));
int x = 0;
} catch (Exception ex) {
ConsoleHelper.printMessage("ERRO_ex:" + ex.getMessage(), new Date());
}
}
// --------------------------------------------- ----
答案 0 :(得分:2)
我不确定它坐在那里一段时间的原因,但是,我不会使用你正在使用的东西。
//table[@width=200]/tbody/tr[1]/td/a/text()
不会给你实际的WebElement
因此,我会采取不同的方法:
//table[@width=200]/tbody/tr[1]/td/a
然后在找到的所有元素上调用.getText()
- 出于这个原因,.getText()
方法就在那里。