检索网站上的电子邮件地址

时间:2013-01-02 03:04:31

标签: php

我是Android应用程序的发布者。

我的网站需要自动检索Android应用数据,但Google Play不支持iTunes Store等API系统。因此,我需要制作一个有助于检索Android数据的PHP命令。我需要获取标题,应用图片,说明和电子邮件地址。

首先,当我知道Google Play网址时,我试图获取电子邮件地址。这是我做的例子。这是华尔街日报应用程序。

华尔街日报Android应用网址 - https://play.google.com/store/apps/details?id=wsj.reader_sp

<a href="mailto:mobilereader@wsj.com" rel="nofollow">Email Developer</a>

当我点击网站时,我可以找到上面的HTML代码。

$Google_Play_URL = 'https://play.google.com/store/apps/details?id=wsj.reader_sp';
$string = file_get_contents($Google_Play_URL);

$parsing = new SimpleXmlElement($string); 
$attrs = (array)$parsing->attributes(); 
$mail = str_replace('mailto:','',$attrs['href']); 
if(filter_var($mail,FILTER_VALIATE_MAIL))
{
   echo $mail;
}

结果应为“mobilereader@wsj.com”,但失败了。你能看到问题吗?谢谢。

2 个答案:

答案 0 :(得分:3)

您可以使用PHP DOMDocument执行此操作,如:

$Google_Play_URL = 'https://play.google.com/store/apps/details?id=wsj.reader_sp';
$string = file_get_contents($Google_Play_URL);

$dom = new DOMDocument();
$dom->loadHTML($string);
$anchors = $dom->getElementsByTagName('a');

foreach ($anchors as $anchor) {
    if ($anchor->nodeValue === 'Email Developer') {
        $email = str_replace('mailto:', '', $anchor->getAttribute('href'));

        if (filter_var($email, FILTER_VALIDATE_EMAIL)) {
            echo $email;
        }
    }
}

您提供的网址的示例输出为:mobilereader@wsj.com

答案 1 :(得分:1)

使用正则表达式匹配电子邮件地址。此外,您在过滤器名称中输入了一个拼写错误。

试试这个:

$Google_Play_URL = 'https://play.google.com/store/apps/details?id=wsj.reader_sp';
$string = file_get_contents($Google_Play_URL);

preg_match('/<a href="mailto\:(.*)" rel="nofollow">Email Developer<\/a>/s', $string, $matches);
if (count($matches) > 0 && filter_var($matches[1], FILTER_VALIDATE_MAIL))
{
   echo $matches[1];
}
相关问题