无论如何,我可以获得一个页面的简单HTML,但有图像和链接?

时间:2015-04-08 17:17:24

标签: wikipedia wikipedia-api

使用此查询:

http://en.wikipedia.org/w/api.php?format=xml&action=query&prop=extracts&titles=aristotle&redirects=true

我以最简单的HTML格式获取页面。真的很基本的东西。 但我真正想要的是获得该页面中的图像和链接。

我还尝试了其他选项(action=parseaction=query),但它们以css样式或未解析的响应形式返回了过多的开销。

我可以通过图片和链接实现简单的HTML内容吗?

1 个答案:

答案 0 :(得分:0)

我认为禁用页面上的CSS应该做我认为你要求的。

在Chrome中,您可以在开发者控制台中执行此操作:

  1. 通过点击F12或导航到它来启动开发者控制台 菜单 - >更多工具 - > Developer Console。
  2. 在开发者控制台中,浏览到“来源”选项卡。在此选项卡的左上角是一个带有左箭头的图标。点击它。
  3. 浏览到要消除的css文件。从网络层开始,向下工作,似乎效果最好。突出显示所有文本并点击删除。
  4. 删除样式表,直到获得所需的结果。
  5. 此stackoverflow文章还有其他选项: How to disable CSS in Browser for testing purposes