我正在尝试对维基百科中的表进行简单的打印,在编写我自己的代码时出错不通,我决定使用一个教程示例并进行构建。然而,这不起作用,我没有想到为什么。
这是此处的代码,其中包含适当的链接。我的最终结果是一个空列表“[]”。我正在使用PyCharm 2017.2,beautifulsoup 4.6.0,请求2.18.4& python 3.6.2。任何建议表示赞赏作为参考,教程网站为here
categoryService =
CategoryClient.getClient().create(CategoryService.class);
Call<ArrayList<Category2>> call = categoryService.getProjectCategories(projectId,token);
call.enqueue(new Callback<ArrayList<Category2>>() {
@Override
public void onResponse(Call<ArrayList<Category2>> call, Response<ArrayList<Category2>> response) {
listCategories = response.body();
System.out.println("Size: " + listCategories.size().toString());
}
@Override
public void onFailure(Call<ArrayList<Category2>> call, Throwable t) {
// Log error here since request failed
Log.e(TAG, t.toString());
}
});
答案 0 :(得分:1)
您可以使用正则表达式完成此操作。
requests.get(WIKI_URL).content
<table>(?P<table>*+?)</table>
)。这样做可以在<table>
和</table>
令牌之间获得任何内容。使用python进行正则表达式的documentation好。看看re.findall()
。re.findall()
再次成为关键。