如何检测HTML页面是否包含视频?

时间:2010-04-25 20:05:52

标签: html video

我想知道是否可以检测HTML页面是否包含视频。

我知道一种可能的方法是在HTML源代码中查找“.swf”。但是大多数页面都不包含文件名。

例如,给定以下URL以及可能的源代码,是否可以找出它是否包含视频: http://www.cnn.com/video/

4 个答案:

答案 0 :(得分:9)

有很多方法可以将视频嵌入到HTML页面中 - 通过<object><embed>标记作为Flash视频或特定于平台的玩家实例(但不是每个标记都是视频!同样适用于.swf - 它只是Flash文件的文件扩展名,视频与否),新的HTML 5 <video>标签......它们并非不可能找到,但它有很多努力捕捉所有可能的玩家类型,格式和嵌入代码,并将导致大量误报/否定。

然后,有一些JavaScript库在包含页面加载后初始化播放器 - 这几乎是不可能检测到的。

将视频可靠地导入网页仍然是一个非常复杂的问题,随后,找到它 out 会更加复杂。根据你想要达到的目标,我会考虑放弃它。

答案 1 :(得分:0)

检查DOM中是否存在<object>标记并检查其内容类型和参数。你会自己找到这种模式。

答案 2 :(得分:0)

在CNN上,您可以解析Open Graph微标记以获取视频信息。

元标记,例如og:video:type, og:image

视频托管服务通常支持微标记,即开放图形或scheme.org。

所以你可以解析这个标记。

答案 3 :(得分:-1)

您还可以在源代码中搜索.flv或.mp4。