在PHP中从HTML中提取句子

时间:2014-01-24 10:56:54

标签: php html codeigniter text-extraction

我正在对文本摘要进行PHP项目(使用Codeigniter),为此我需要从Rich TextBox的内容中提取句子(此内容包含标签)。因此是否有适当的方法或Codeigniter库从包含HTML标签的内容中提取句子

2 个答案:

答案 0 :(得分:1)

此技术称为网络抓取

查看this

答案 1 :(得分:1)

php函数strip_tags()可以帮助你。它返回没有php和html标签的字符串。如果你只需要计算句子,你可以做 count(explode(“。”,$ text))分隔符是句子的典型结尾。

简单而有限,但不需要任何库。