如何使用DOM解析器提取变量中html元素的内容。
更确切地说: 我有一个表单,用户在文本区域输入html。我想提取第一段的内容。
我知道有很多这方面的教程,但找不到从变量而不是文件中提取的任何内容(页面)
由于
答案 0 :(得分:1)
如果您将HTML作为用户输入,我建议您使用simplehtmldom。它有一个松散的解析器,可以容忍错误的html,并允许你使用CSS选择器将元素及其内容从DOM中拉出来。
我没有对此进行测试,但它应该有效:
$html = str_get_html($_POST['input']);
print $html->find('p:first')->plaintext; // first paragraph