我需要将排行榜的结果在这里将secondsync.com/leaderboard.html#Wed-May-22-2013/totals转换为Feed。
他们使用js来提取这些信息。如何识别JS并从另一页中提取数据?
感谢。
答案 0 :(得分:1)
也许你可以使用这个教程
http://www.1stwebdesigner.com/tutorials/php-crawler-tutorial/(需要一些PHP和REGEX技能)
要抓取页面内容,请使用REGEX访问您需要的内容。
使用正则表达式,你可以匹配()第一个:
<td class="tweets">*<td>
你应该得到像
这样的东西<td class="tweets">91,621<td>
然后每隔&lt; *&gt;替换()用''
并且号码为91,621。
这可以修改为&lt;'td class =“peak”&gt; *, 如果你对峰值或类似的东西感兴趣,只需查看它们(secondsync)如何在源代码中描述它。
很抱歉没有更好的帮助,我现在想不出更好的解决方案。