从视频名称中提取电影标题

Extract movie title from video name

本文关键字:提取 电影 标题 视频      更新时间:2023-09-26

我正在尝试将YouTube视频名称与电影匹配,如果该视频对应于预告片或类似内容。

以下是一些示例

饥饿游戏:Mockingjay 第 2 部分官方预告片——"我们一起游行"

钢铁侠 - 预告片 [高清]

迪士尼冰雪奇缘官方预告片

星球大战:原力觉醒预告片(官方)

火星救援 |预告片 [高清] |20世纪福克斯

如您所见,有很多垃圾,例如"官方","预告片","高清","预告片",出版公司,例如"迪士尼"或"20世纪福克斯",以及其他不属于电影名称的词。有时它包含引号或预告片名称,就像饥饿游戏中的情况一样。

除了删除所有常用词和公司的幼稚解决方案之外,我还能采取什么其他方法?

如果您已经在代码中知道电影名称,则可以检查视频标题是否包含电影名称。如果您只想从该字符串中删除特殊单词,则不会专门执行此操作。

你确定要只使用 JavaScript 来做到这一点吗?考虑到可用的电影标题的数量,您最好使用数据库和服务器端代码(包括服务器上的JavaScript),因为它们旨在比单独的JavaScript更快地解析大型数据集。我建议更多地考虑这个问题的架构。

取而代之的是,使用电影数据库的 API 搜索电影可能比尝试构建自己的解析器更简单。您可以在此处阅读按电影搜索的文档:http://docs.themoviedb.apiary.io/#reference/search/searchmovie