我正在使用php和cURL来获取各种网站的内容。
这是一个谷歌地图信息窗口:https://google-developers.appspot.com/maps/documentation/javascript/examples/infowindow-simple
现在,我想获取信息窗口中的内容。有办法吗?
答案 0 :(得分:2)
在这种特殊情况下,infowindow中的数据嵌入在html本身的脚本标记中,因此从URL下载html,然后创建正则表达式以提取infowindow的内容(在本例中为名为contentString的变量很容易做到。
有些网站不会直截了当,需要采用各种方法来收集信息。动态网站可以使用ajax调用填充信息窗口的内容,或者内容可能包含在单独的脚本或json文件中。如果您决定抓取每个网站的内容,您可能需要为每个网站进行一些自定义编码。