什么在抛弃我的str_word_count?

时间:2011-12-13 20:59:07

标签: php

我正在使用PHP的函数通过POST来计算textarea中的单词数...

问题在于,如果我回复我的文件并输出单词计数,则不同于我将相同的文本复制并粘贴到我的PHP脚本中以评估单词计数。

丢掉这个号码是什么?有6个字的差异,顺便说一下,textarea也有6个双线断点。

如何最大限度地减少这种差异?

2 个答案:

答案 0 :(得分:0)

如果您的换行符是HTML格式,则可以使用strip_tags()

之类的内容

如果不是,我怀疑编码问题。也许striplash,utf8_encode或utf8_decode的组合可以解决这个错误的计算单词。

作为最后的手段,您可以使用一些正则表达式来过滤除[a-zA-Z]和空格之外的任何内容。

答案 1 :(得分:0)

您可以完全删除换行符和标记:

str_word_count(str_replace('<br>', '', nl2br(strip_tags($data))));

或者我猜这更好:

str_word_count(strip_tags(nl2br($data)));