我正在对文本摘要进行PHP项目(使用Codeigniter),为此我需要从Rich TextBox的内容中提取句子(此内容包含标签)。因此是否有适当的方法或Codeigniter库从包含HTML标签的内容中提取句子?
答案 0 :(得分:1)
此技术称为网络抓取
查看this
答案 1 :(得分:1)
php函数strip_tags()可以帮助你。它返回没有php和html标签的字符串。如果你只需要计算句子,你可以做 count(explode(“。”,$ text))分隔符是句子的典型结尾。
简单而有限,但不需要任何库。