获取页面标题的好策略是什么?

时间:2015-10-27 16:00:10

标签: php regex parsing

...服务器端并使用PHP。

关于何时使用正则表达式,我读了这个SO article,它基本上表明你可以在某些情况下使用正则表达式解析HTML。

<title></title>

应该很容易匹配。

我认为没问题。我认为很受欢迎的答案是因为没有b.c.正确但但是b.c.夹带值。

这是O.K吗?

2 个答案:

答案 0 :(得分:1)

是的,它是

/<title[^>]*>(.*?)<\/title>/is

不同的人有不同的意见。如果你知道自己在做什么,那么你应该只使用正则表达式。
这可能是一个非常有趣的读物:When you should NOT use Regular Expressions?

答案 1 :(得分:0)

最好的办法是使用HTML解析库(如this one),而不是正则表达式。在这种情况下你可能会使用正则表达式,但这就像用锤子敲打螺丝一样。

如果您正在寻找HTML中的任何重要内容,正则表达式将会非常混乱且难以阅读,并且在许多情况下,正则表达式无法在不对HTML内容做出许多假设的情况下完成工作。 / p>