从视频名称中提取电影标题
Extract movie title from video name
我正在尝试将YouTube视频名称与电影匹配,如果该视频对应于预告片或类似内容。
以下是一些示例
饥饿游戏:Mockingjay 第 2 部分官方预告片——"我们一起游行"
钢铁侠 - 预告片 [高清]
迪士尼冰雪奇缘官方预告片
星球大战:原力觉醒预告片(官方)
火星救援 |预告片 [高清] |20世纪福克斯
如您所见,有很多垃圾,例如"官方","预告片","高清","预告片",出版公司,例如"迪士尼"或"20世纪福克斯",以及其他不属于电影名称的词。有时它包含引号或预告片名称,就像饥饿游戏中的情况一样。
除了删除所有常用词和公司的幼稚解决方案之外,我还能采取什么其他方法?
如果您已经在代码中知道电影名称,则可以检查视频标题是否包含电影名称。如果您只想从该字符串中删除特殊单词,则不会专门执行此操作。
你确定要只使用 JavaScript 来做到这一点吗?考虑到可用的电影标题的数量,您最好使用数据库和服务器端代码(包括服务器上的JavaScript),因为它们旨在比单独的JavaScript更快地解析大型数据集。我建议更多地考虑这个问题的架构。
取而代之的是,使用电影数据库的 API 搜索电影可能比尝试构建自己的解析器更简单。您可以在此处阅读按电影搜索的文档:http://docs.themoviedb.apiary.io/#reference/search/searchmovie
相关文章:
- EaseJS拖放;放下(动画CC)电影剪辑的鼠标坐标
- 在数据提取完成之前进行页面渲染
- 如何在Javascript中从字符串中提取某些单词
- RegEx JavaScript:数字后的符号提取
- 如何在内联依赖项并将图像转换为dataURI的情况下完全提取网页
- Regex提取URL返回数组的一部分;未定义”;
- 如何提取“;href"最近列表项中的属性值
- 使用时刻.js从日期时间中提取时间
- 通过javascript从会话中提取用户名
- HTML页面如何提取通过表单传递的参数
- 是否可以自动拉取“随机”;标签“;从一长串文本中提取
- innerHTML的子字符串可以在初始调用时提取吗
- 如何使用phonegap从安卓设备中提取联系人的字母顺序
- 如何从特定页面中提取php变量值
- 从字符串中提取年份的Javascript正则表达式
- 如何使用JavaScript提取此url的一部分
- 使用BeautifulSoup从Javascript中提取文本以获得关注者数量
- 使用javascript从字符串中提取浮点数
- 如何使用另一个字符串作为模板从字符串中提取数据
- 从视频名称中提取电影标题