如何在PhantomJs中使用动态网址废弃网页

时间:2016-07-20 09:42:56

标签: c# web-scraping

通过使用简单的硬编码网址,它可以正常工作

 var phantomJS = new PhantomJS();
 phantomJS.RunScript(@"var page = require('webpage').create();
                                            page.open('http://search4best.com',
                                            function(){var arg = page.evaluate(function(){return document.getElementById('form_div').innerHTML;})
                                            console.log(arg);
                                            phantom.exit();})", new string[]{}, null, null);

但问题是我正在尝试使用动态网址废弃网页

  var url = "http"//search4best.com";    
    string JavaScript = "var page = require('webpage').create();"
                                                +"page.open('"+url+"',function()"+
                                                "{var arg = page.evaluate(function(){return document.getElementById('form_div').innerHTML})"+
                                                "console.log(arg)phantom.exit()})";

phantomJS.RunScript(@JavaScript, new string[] {},null,null);

感谢您的建议。

1 个答案:

答案 0 :(得分:0)

但我通过使用逐字字符串

解决了问题
<?xml version="1.0"?>
<layout>
    <default>
        <reference name="head">
            <action method="addItem">
                <type>skin_css</type>
                <name>css/tweaks.css</name>
                <params/>
                <if><![CDATA[<!--[]><!-->]]></if>
            </action>
        </reference>
    </default>
</layout>