如何将多个网站html表格刮到一个excel文件中?

时间:2011-04-09 09:59:06

标签: php html regex web-crawler export-to-excel

我有一个网址列表,我想用* .txt格式。任何人都可以建议我如何编写一个集成正则表达式的PHP代码,并将列出的url的所有html表格刮到一个excel文件中。我曾尝试手动执行此操作,但由于网址数量庞大,因此花费了我很多时间。

对于手动抓取,我已将html代码复制到记事本并保存为html文件并将文件拖放到excel,为我提供了我想要的excel文件。

请发送回复并提供正确的代码。

1 个答案:

答案 0 :(得分:0)

您可能希望查看Google Spreadsheets的importHTML()函数 - 一旦导入,您就可以下载一个URL,您可以将其下载为CSV(或其他格式),并且无论如何都可以操作