由于facebook不允许我们导出我们的朋友联系方式,我想手动完成。但由于我有超过500个联系人,我需要稍微自动化它。这就是我的工作:
1)首先我在https://www.facebook.com/friends使用了DownThemAll firefox插件来获取我所有朋友个人资料的链接。
2)在excel中,我在每个链接的末尾更改了添加/关于(或者& sk =约为那些没有用户名的人)的网址
3)使用DownThemAll我全部下载了#34;关于"我朋友的页面。
4)我使用这个windows命令将所有文件合并为一个:
copy *.* merged.txt
5)在merged.txt文件中,我更改了每个双引号#34;进入\"稍后在php文件中使用它作为变量
6)这是我需要你帮助的一步。我想将这个巨大的合并文件解析成不错的csv。我想过在php中使用正则表达式。
我的想法是使用这样的代码:
<?php
$content="here I paste everything from merged.txt";
$regex_pattern = "this is what I need from you";
preg_match_all($regex_pattern,$content,$matches);
print_r($matches);
?>
我检查了关于页面的Facebook代码,我感兴趣的部分可以像这样匹配:
- 每个新记录以&lt; html lang =&#34; en&#34;开头ID =&#34; Facebook和#34;类=&#34; no_js&#34;&GT;并以&lt; / html&gt;
结束-name可以从具有class =&#34; _8_2&#34;
的唯一元素中获取<a class="_8_2">name</a>
-telephone可以从唯一具有dir =&#34; ltr&#34;
的范围中获取<span dir="ltr">123456789</span>
-email是唯一的mailto链接
<a href="mailto:abc@abc.com">
-skype是唯一的callto链接
<a href="callto:skypelogin" class="uiLinkDark">
请记住,有些用户只在他们的页面上发送电子邮件或只有电话。因此,正则表达式也必须捕获这些情况。
有人能帮助我吗?提前谢谢。
顺便说一句,我知道有更简单的方法将联系人导出到雅虎然后打印它们。但请不要提出建议,因为它不会导出电话号码。