我即将创建一个翻译网站(在PHP中),人们可以命令翻译人员翻译他们的文档。从该网站,人们可以上传他们的文件,然后它将连接到该网站的翻译/成员。问题是如何创建一个从文档中计算价格的应用程序。
评价翻译价格的最常用方法是按字词。所以我需要知道客户上传的文档中有多少单词。我认为必须有可能从文本文件中计算单词,例如word文档。但是,我找不到任何方法来获取ms word 2003文档(.doc)的确切数量。我找到了计算.docx的方法,但不是.doc。并且会有更多文件,例如PDF或rtf。
我见过另一种只计算文件大小的方法,但我不认为它会为不同的文档格式提供相同的结果。或者是? 我能想到的简单方法是让访问者将文本复制/粘贴到文本区域,但我不认为这是最好的方法。
有人会给我一个建议我该如何解决这个问题?
答案 0 :(得分:0)
如果您在* nix服务器上运行您的站点,您可能需要尝试以下操作:
$word_count = system("wc -w " . $filename);
而且,是的,我一直认为它适用于.doc和.docx文件。 PDF是另一个故事。我将不得不研究那个。