我想知道是否可以检测HTML页面是否包含视频。
我知道一种可能的方法是在HTML源代码中查找“.swf”。但是大多数页面都不包含文件名。
例如,给定以下URL以及可能的源代码,是否可以找出它是否包含视频: http://www.cnn.com/video/
答案 0 :(得分:9)
有很多方法可以将视频嵌入到HTML页面中 - 通过<object>
和<embed>
标记作为Flash视频或特定于平台的玩家实例(但不是每个标记都是视频!同样适用于.swf
- 它只是Flash文件的文件扩展名,视频与否),新的HTML 5 <video>
标签......它们并非不可能找到,但它有很多努力捕捉所有可能的玩家类型,格式和嵌入代码,并将导致大量误报/否定。
然后,有一些JavaScript库在包含页面加载后初始化播放器 - 这几乎是不可能检测到的。
将视频可靠地导入网页仍然是一个非常复杂的问题,随后,找到它 out 会更加复杂。根据你想要达到的目标,我会考虑放弃它。
答案 1 :(得分:0)
检查DOM中是否存在<object>
标记并检查其内容类型和参数。你会自己找到这种模式。
答案 2 :(得分:0)
在CNN上,您可以解析Open Graph微标记以获取视频信息。
元标记,例如og:video:type, og:image
视频托管服务通常支持微标记,即开放图形或scheme.org。
所以你可以解析这个标记。
答案 3 :(得分:-1)
您还可以在源代码中搜索.flv或.mp4。