实时获取可能数百万个远程URL的页面标题和元标记内容的最佳方式(在PHP中)是什么?
此外,使用单个共享服务器是否可行?
到目前为止,我正在研究4种可能性。 (我也在使用Codeigniter)
答案 0 :(得分:2)
您无法在共享服务器上实时执行数百万次。你很可能会因使用太多CPU而关机。但是如果你使用的是PHP,最好的办法就是使用多卷曲。查看一个非常相似的问题,其中包含代码示例:
答案 1 :(得分:0)
这取决于你的目的。实际上在任何情况下你都应该使用异步方法。在PHP中,您可以尝试使用curl与异步套接字或pcntl扩展(形式cgi模式)。 或者你也可以使用如此受欢迎的node.js(但它根本不是PHP :))
答案 2 :(得分:0)
您可以尝试使用PHP Simple HTML DOM Parser。使用此DOM Parser,您将获得整个页面内容并解析头部标题和元标记。