PHP - 从上传的Microsoft Word文档中获取字数

时间:2013-07-31 10:24:28

标签: php upload ms-word .doc

我正在尝试从上传的单词doc (.doc, .docx, .rtf)中获取一个单词计数,但它总是通过令人讨厌的Word格式进行。

之前有人解决了这个问题并知道如何解决它吗? 谢谢:))

1 个答案:

答案 0 :(得分:4)

您需要:

  1. 区分文件类型

    $file_name = $_FILES['image']['name'];
    $file_extn = end(explode(".", strtolower($_FILES['image']['name'])));
    
    if($file_extn == "doc" || $file_extn == "docx"){
        docx2text();
    }elseif($file_extn == "rtf"){
        rtf2text();
    }
    
  2. 将文档转换为文本

    对于doc或docx,

    https://stackoverflow.com/a/7371315/2512934 {rtf

  3. http://webcheatsheet.com/php/reading_the_clean_text_from_rtf.php
  4. 计算单词 http://php.net/manual/en/function.str-word-count.php