如何使用Wikipedia API从Wikipedia页面的特定部分提取数据?

时间:2019-12-26 09:50:10

标签: android json mediawiki-api

我想从Wikipedia提取蔬菜/水果的营养部分,并希望将其显示在我的Android应用中。

I am taking about the table in the right hand side of the picture

这是我到目前为止所得到的。

提取“ Banana”的“营养”部分

https://en.wikipedia.org/w/api.php?action=parse&page=banana&prop=wikitext&section=23&format=json

但是我不知道如何从我从上面链接获得的数据中滤除该表(上图右侧的表)。解析这些数据时我必须在代码中弄清楚还是我必须对URL做些事情?

有人可以帮我吗?

1 个答案:

答案 0 :(得分:0)

是的,您必须自己做。您可以使用https://en.wikipedia.org/api/rest_v1/page/mobile-sections/Banana,它使用起来稍微容易一些(OTOH,它更集中在内部,因此不稳定),并且确实删除了HTML的某些部分,但是您仍然必须处理表格。或者,您可以尝试使用下一代HTML渲染器的https://en.wikipedia.org/api/rest_v1/page/html/Banana,并且在HTML中包含更多元数据,这样可能更容易进行转换,但是您仍然必须自己进行转换。