我的结果是这样。我终于得到了wget来抓取我想要的页面,我想要它,但是我无法将变量传递给system()函数以循环遍历我想要的所有URL。
当前工作wget请求:
system('/usr/local/bin/wget -O wget-files/fda-test.txt "http://www.accessdata.fda.gov/scripts/cder/drugsatfda/index.cfm?fuseaction=Search.Overview&DrugName=AEROSEB%2DDEX" 2>&1');
我无法开展工作:
我想将文件名设置为$ file_name,并将请求的URL设置为$ url,但我尝试的所有内容都会破坏它。
有几点需要注意,我已经尝试过curl,由于重定向302,它无法正常工作。我已经研究过Node.js和Phantom以及其他一些解决方案,我并不特别喜欢这个项目中的任何一个。 Wget为此工作得很漂亮,我只需要动态请求,这样我就可以遍历记录了。
有什么建议吗?
答案 0 :(得分:1)
system('/usr/local/bin/wget -O wget-files/fda-test.txt '.$file_name.$url' 2>&1');
在我修改它之后,这是有用的,但感谢Dragon的对话。 -Brent
// Wget the pages
system('/usr/local/bin/wget -O wget-files/'.$file_name.' "http://www.accessdata.fda.gov/scripts/cder/drugsatfda/index.cfm?'.$source.'" 2>&1');