从HTML表中获取电子邮件地址

时间:2009-12-27 16:47:03

标签: php html

我有一个HTML表格,其中包含此 file.html 中的500个电子邮件地址。 现在我想用PHP打开它并获取其中的所有电子邮件地址并将其添加到数组中。 这意味着我有一个HTML表,在这个表中有500行,每行都有一个电子邮件地址。

如何使用PHP获取这些电子邮件地址?

4 个答案:

答案 0 :(得分:1)

您可以通过php解析HTML以访问相关部分并将它们存储在您的数据结构中以供进一步处理,有关PHP html解析的简短介绍,请访问:http://www.onderstekop.nl/articles/114/

答案 1 :(得分:1)

我同意MYYN的方法,但我建议您使用phps DOM类来遍历表中的所有td并获取电子邮件。

以下是一些有用的功能:

loadHTMLFile

getElementsByTagName

答案 2 :(得分:1)

我会避免所有HTML / regexp问题的regexp并使用HTML解析器,例如this one。提取表格的DOM并包含单元格/内容应该是微不足道的。

请注意,用于识别电子邮件的正则表达式可能非常复杂,具体取决于您希望匹配的电子邮件的种类。 SO有很多例子。

答案 3 :(得分:0)

您可以使用正则表达式将整个HTML字符串与电子邮件匹配项匹配。

http://www.regular-expressions.info/email.html