我有一个代码片段,循环提交Callable,然后检查这些是否已完成,如果是,则打印出他们的值
ArrayList<Future<ArrayList<String>>> controllList = new ArrayList<Future<ArrayList<String>>>();
System.out.println(""+pagecount);
for(int n=1;n<=pagecount;n++){
if(controllList.size()<10){
Future<ArrayList<String>> temp = exeService.submit(new URLSpider("localhost"));
controllList.add(temp);
}
for(int k=0;k<controllList.size();k++){
if(controllList.get(k).isDone()){
System.out.println("Something done");
ArrayList<String> URLs = controllList.get(k).get();
for(int h=0;h<URLs.size();h++){
System.out.println(URLs.get(h));
}
controllList.remove(k);
}
}
}
URLSpider类:
public class URLSpider implements Callable<ArrayList<String>> {
private TagNode node;
private String pageUrl;
private Object[] links;
private ArrayList<String> detailLinks;
public URLSpider(String completePageURL){
pageUrl = completePageURL;
detailLinks = new ArrayList<String>();
}
@Override
public ArrayList<String> call() throws Exception {
HtmlCleaner cleaner = new HtmlCleaner();
try {
node = cleaner.clean(new URL(pageUrl));
} catch (IOException e1) {
e1.printStackTrace();
}
try {
String link;
links = node.evaluateXPath("some XPath");
for(int i =0;i<links.length;i++){
link=((TagNode)links[i]).getAttributeByName("href");
System.out.println(link); //the code produces URLs as wanted
detailLinks.add(link);
}
} catch (Exception e) {
e.printStackTrace();
}
return detailLinks;
}
}
我的问题是第二个for-Loop中的if语句永远不会变为真。我检查了调用方法是否到达结尾。它每次都这样做。此外,detailURL列表中还包含所需的URL。但只是isDone()一直都是假的。
有人可以告诉我这里我做错了什么吗?
答案 0 :(得分:6)
因为当您迭代列表时,所有Callables都没有完成。
如果要在Callable完成之前阻止,可以调用controllList.get(k).get()
- 这将阻止,直到任务完成。
对于您的用例,您还可以查看ExecutorCompletionService executor。