我想从Wikipedia提取蔬菜/水果的营养部分,并希望将其显示在我的Android应用中。
这是我到目前为止所得到的。
提取“ Banana”的“营养”部分
https://en.wikipedia.org/w/api.php?action=parse&page=banana&prop=wikitext§ion=23&format=json
但是我不知道如何从我从上面链接获得的数据中滤除该表(上图右侧的表)。解析这些数据时我必须在代码中弄清楚还是我必须对URL做些事情?
有人可以帮我吗?
答案 0 :(得分:0)
是的,您必须自己做。您可以使用https://en.wikipedia.org/api/rest_v1/page/mobile-sections/Banana,它使用起来稍微容易一些(OTOH,它更集中在内部,因此不稳定),并且确实删除了HTML的某些部分,但是您仍然必须处理表格。或者,您可以尝试使用下一代HTML渲染器的https://en.wikipedia.org/api/rest_v1/page/html/Banana,并且在HTML中包含更多元数据,这样可能更容易进行转换,但是您仍然必须自己进行转换。