从wiki表中提取数据的最佳方法是什么,以及从该表到JSON的链接?

时间:2015-01-14 07:19:36

标签: ruby-on-rails json api wikipedia

我是网络开发人员的新手,并且有从维基百科中获取数据的问题。我正在制作一个个人网络应用程序,将跟踪过去的UFC事件。我无法找到包含事件详细信息和结果的开源API。但是维基百科上的下表有很多我需要的信息:http://en.wikipedia.org/wiki/List_of_UFC_events 我已经看过几个关于如何从wiki表获取信息并使用谷歌电子表格或其他软件(如openrefine)将其格式化为.csv格式的教程。但是,我也想要每个活动的信息(战斗结果,获奖者,获奖者,海报图片等),每个事件的自己的维基页面都在我上面提到的表格上。我想知道,提取这些信息最简单的方法是什么?

1 个答案:

答案 0 :(得分:0)

您可以使用nokogiri gem来废弃网页