使用JS显示信息的页面 - 需要提取该信息

时间:2013-05-23 15:58:21

标签: javascript html feed text-extraction html-content-extraction

我需要将排行榜的结果在这里将secondsync.com/leaderboard.html#Wed-May-22-2013/totals转换为Feed。

他们使用js来提取这些信息。如何识别JS并从另一页中提取数据?

感谢。

1 个答案:

答案 0 :(得分:1)

也许你可以使用这个教程
http://www.1stwebdesigner.com/tutorials/php-crawler-tutorial/(需要一些PHP和REGEX技能)
要抓取页面内容,请使用REGEX访问您需要的内容。

使用正则表达式,你可以匹配()第一个:

<td class="tweets">*<td>

你应该得到像

这样的东西
<td class="tweets">91,621<td>

然后每隔&lt; *&gt;替换()用''

并且号码为91,621。

这可以修改为&lt;'td class =“peak”&gt; *, 如果你对峰值或类似的东西感兴趣,只需查看它们(secondsync)如何在源代码中描述它。

很抱歉没有更好的帮助,我现在想不出更好的解决方案。