经常使用PHP解析和存储文本

时间:2013-11-23 04:52:24

标签: php regex parsing text

我正在创建一个php脚本,使用正则表达式解析一般文本为500-750个字符的字符串,以查找5-6个子字符串。提取的信息稍微操作一下,然后存储在数据库中。一旦实现,脚本将在一天中平均每隔几秒执行一次。一般的网络服务器是否能够处理这种级别的使用?我不确定这种类型的脚本对于执行频率的内存密集程度如何。

我正在考虑减少服务器负载的可能方法,并想出了一个我不确定更好的想法。我可以将它存储在数据库中以便稍后解析,而不是在收到时立即解析原始文本。在整个一天中,我可以让服务器以可管理的数量和低网站流量期间处理信息。如果这是一个解决方案,下面的算法是否可以接近它?

  1. 选择一些尚未从数据库中解析的文本记录
  2. 从文本中提取信息并将其添加到数据库
  3. 更新文本记录以表明它们已被解析
  4. 使用<meta http-equiv="refresh">
  5. 重新加载脚本
  6. 重复x次
  7. 对于如何处理此问题的任何建议将不胜感激,谢谢!

1 个答案:

答案 0 :(得分:0)

从你的描述来看,它似乎并不是服务器上非常苛刻的东西。

我建议实现最简单的解析和存储数据的解决方案。然后通过加载数据来提供这段代码并测量吞吐量。这可以让您了解处理记录的速度有多快。

在此之后,您可以估计这种简单的方法是否足够。