这可能是重复的。
但我想知道如何使用简单的HTML DOM Parser或段落末尾有更多按钮(可能被称为链接)的其他内容从段落中获取文本。
例如
This is test string and I want to get this data but don't know how to
[more...]
和实际文本是
This is test string and I want to get this data but don't know how to get it
Please anybody help me.
所以任何能够解释我怎样才能得到完整段落的人。 提前致谢
答案 0 :(得分:2)
此网页的所有源代码都已重新格式化并使用JavaScript重新排列,并且由于简单HTML DOM 无法处理JS,因此您必须处理原始代码(在JS更改之前),您可以检查使用 ctrl + U ...然后,根据它,你正确地编写你的解析器......
他是回答你问题的工作代码:
// includes Simple HTML DOM Parser
include "simple_html_dom.php";
$url = 'http://www.linkedin.com/company/1015?trk=vsrp_companies_res_name&trkInfo=VSRPsearchId%3A2646459271384809644652%2CVSRPtargetId%3A1015%2CVSRPcmpt%3Aprimary#';
//Create a DOM object
$html = new simple_html_dom();
// Load HTML from a string
$html->load_file($url);
// Get the node having "text-logo" class
$div = $html->find('div.text-logo', 0);
echo $div;
echo "<hr>";
// Get logo node
$logo = $html->find('img.logo', 0);
echo $logo->alt ." => ". $logo->src;
// Clear dom object
$html->clear();
unset($html);