我正在使用PHP的函数通过POST来计算textarea中的单词数...
问题在于,如果我回复我的文件并输出单词计数,则不同于我将相同的文本复制并粘贴到我的PHP脚本中以评估单词计数。
丢掉这个号码是什么?有6个字的差异,顺便说一下,textarea也有6个双线断点。
如何最大限度地减少这种差异?
答案 0 :(得分:0)
如果您的换行符是HTML格式,则可以使用strip_tags()
之类的内容如果不是,我怀疑编码问题。也许striplash,utf8_encode或utf8_decode的组合可以解决这个错误的计算单词。
作为最后的手段,您可以使用一些正则表达式来过滤除[a-zA-Z]和空格之外的任何内容。
答案 1 :(得分:0)
您可以完全删除换行符和标记:
str_word_count(str_replace('<br>', '', nl2br(strip_tags($data))));
或者我猜这更好:
str_word_count(strip_tags(nl2br($data)));