需要搜索msword / pdf文件的内容以查找文本短语并返回匹配的文档。我有超过10000个文件。读取所有文档以搜索文本短语并返回哪一个更快?是将word / pdf文件的内容存储在MySQL表格还是文本文件中?
如何最好地将msword / pdf文档内容存储在MySQL数据库中? MySQL表中最好使用哪种数据类型?
答案 0 :(得分:0)
我会用word或pdf保存所有内容,但不是用PHP搜索文档,而是使用python脚本来搜索文档,从PHP调用它并将匹配的文档返回给PHP。对于这样的事情,Python要快得多。
如果您在数据库中有文档内容,mysql搜索也会很快,但是您对内容长度有一些限制(here是关于限制的一些信息)并且您还必须阅读所有文档并将它们保存到数据库中。我认为你可以节省大量时间来制作一个python脚本来搜索它们。
修改强>
以下是一些性能测试(2016年)。如果您使用的是PHP 7,它实际上是最快的。 https://blog.famzah.net/2016/02/09/cpp-vs-python-vs-perl-vs-php-performance-benchmark-2016/
同时检查this article => “Python被认为是开发处理大量数据所需的科学应用程序和应用程序的最佳编程语言。”