我的主要原因是对不同的选择有所了解。我在目录中有文件/拇指与视频相关联,当我必须得到它们时,我使用glob()函数glob(DIRECTORY./file_name*.jpg);它返回视频的所有JPG文件的数组。
glob函数本身非常快但我仍然关注使用,因为在每个页面上可以有20到50个视频,所以会有20到50个glob调用,我应该继续使用它还是开始将数据放入数据库中来获取文件列表从那里而不是glob(); ?
如果有更好的选择,请告诉我。
感谢。
答案 0 :(得分:6)
与性能问题一样,结果可能会有很大差异,因此答案是:对于你而言,更快的是更快的作品。
开始的地方是衡量现在做事情所花费的时间。完成后,问问自己:这个足够快吗?可能是,虽然它可能不是最快速的做事方式,但速度仍然很快,速度不是问题。
处理页面花费了多少时间来获取文件全局? 1%? 10%? 50%?这个百分比越高,考虑改变你做事的方式就越有价值。
此外,网站整体表现如何?如果你加倍每页加载的速度,人们会注意到吗?如果没有,那么即使你看到明显的地方也可能不值得进行性能调整。
如果您认为自己可以做得更好,请使用您的数据库实施功能,并测量是否更快。同样,这样的结果可能是高度可变的。例如,如果您的数据库负载很重,那么从数据库获取结果可能会慢得多。如果你有一个几乎没有使用的强大的数据库,它可能会非常快。只有测试可以说实话。
我将补充一点,您现在的工作方式似乎更简单,更易于维护,因为它根据磁盘上的实际文件找到文件名。如果您尝试使用数据库,则必须担心将数据库中的文件名列表与文件系统中的文件列表同步。
但有一点需要注意的是,当你有一个包含大量文件的目录时,许多文件系统的性能会更差。如果遇到这种情况,请考虑将文件拆分为多个子目录。一种流行的方法是创建名称为az的目录,然后将所有以“a”开头的文件放在“a”目录中,所有以“b”开头的文件放在“b”目录中,等等。但是,这可能只是一旦你拥有成千上万的文件就很重要,即使这样,它依赖于特定的文件系统及其运行的硬件。
(根据评论编辑:)
由于您正在讨论预先计算结果并将结果存储在数据库中,因此我建议比将数据放入数据库更好的方法是使用像http://memcached.org/这样的缓存服务器。您可以将其视为一种混合方法:您仍然按照现在的方式执行操作,但每次需要结果时,首先检查缓存以查看它是否包含结果;如果是,则使用缓存的结果,否则计算新的glob。这避免了使数据库和文件系统保持同步的问题,因为旧的缓存条目可能会过期并被新的正确缓存条目替换。
答案 1 :(得分:0)
如果您已经将视频本身的信息存储在数据库中,则可以考虑在保存视频数据的表格中仅存储每个视频的拇指数。这比查询单独的完整文件名表要快得多,因为您只需要引用已经查询过的记录中的字段。这可能是您当前两个想法之间的妥协。但是,您必须确保拇指的名称一致且可编程。例如,仅给出视频123有4个拇指,您可以生成:
/path/to/video_123/thumb_01.jpg
/path/to/video_123/thumb_02.jpg
/path/to/video_123/thumb_03.jpg
/path/to/video_123/thumb_04.jpg