从视频名称中提取电影标题

时间:2016-02-10 21:22:32

标签: javascript

我正在尝试将YouTube视频名称与电影匹配,如果视频对应于预告片或类似内容。

以下是一些例子

  

饥饿游戏:Mockingjay第2部官方预告片 - “我们一起三月”

     <钢铁人 - 预告片[HD]

     

迪士尼的“冷冻官方预告片”

     

星球大战:原力觉醒预告片(官方)

     

火星人|预告片[HD] | 20世纪福克斯

如你所见,有很多瑕疵,比如“官方”,“预告片”,“高清”,“预告片”,出版公司如“迪士尼”或“20世纪福克斯”等字样这不是电影名称的一部分。有时它包含引号或预告片名称,就像饥饿游戏中的情况一样。

除了删除所有常用词和公司的天真解决方案外,我还可采取其他方法吗?

2 个答案:

答案 0 :(得分:1)

如果您已经知道代码中的电影名称,则可以检查视频标题是否包含电影名称。如果您只想从该字符串中删除特殊单词,则无法专门执行此操作。

答案 1 :(得分:0)

您确定要仅使用JavaScript执行此操作吗?考虑到可用的电影标题数量,最好使用数据库和服务器端代码(包括服务器上的JavaScript),因为它们要比单独使用JavaScript更快地解析大型数据集。我建议更多地考虑这个问题的架构。

代替这一点,使用电影数据库的API搜索电影可能比尝试构建自己的解析器更简单。您可以在此处阅读电影搜索文档:http://docs.themoviedb.apiary.io/#reference/search/searchmovie