如何使用简单的html解析器或其他东西获取值

时间:2013-11-26 07:57:29

标签: javascript php html simple-html-dom

这可能是重复的。 但我想知道如何使用简单的HTML DOM Parser或段落末尾有更多按钮(可能被称为链接)的其他内容从段落中获取文本。 例如 This is test string and I want to get this data but don't know how to [more...]

和实际文本是 This is test string and I want to get this data but don't know how to get it Please anybody help me.

所以任何能够解释我怎样才能得到完整段落的人。 提前致谢

1 个答案:

答案 0 :(得分:2)

此网页的所有源代码都已重新格式化并使用JavaScript重新排列,并且由于简单HTML DOM 无法处理JS,因此您必须处理原始代码(在JS更改之前),您可以检查使用 ctrl + U ...然后,根据它,你正确地编写你的解析器......

他是回答你问题的工作代码:

// includes Simple HTML DOM Parser
include "simple_html_dom.php";

$url = 'http://www.linkedin.com/company/1015?trk=vsrp_companies_res_name&trkInfo=VSRPsearchId%3A2646459271384809644652%2CVSRPtargetId%3A1015%2CVSRPcmpt%3Aprimary#';

//Create a DOM object
$html = new simple_html_dom();
// Load HTML from a string
$html->load_file($url);

// Get the node having "text-logo" class
$div = $html->find('div.text-logo', 0);

echo $div;
echo "<hr>";

// Get logo node
$logo = $html->find('img.logo', 0);

echo $logo->alt ." => ". $logo->src;

// Clear dom object
$html->clear(); 
unset($html);

Working DEMO