在线阅读服务

Online readability service?

本文关键字:服务 在线阅读      更新时间:2023-09-26

是否有任何web API接受URL并给出该页面的可读内容?或者有任何javascript库可以做到这一点?

不允许安装node.js或任何服务器端应用程序

这实际上是一个很难的问题。这样的问题通常意味着您希望排除侧边栏和类似的"噪声"元素。这通常是通过机器学习计算机领域内的不同训练集来解决的,并且不容易开发。

说到这里,请看:

  • http://www.alchemyapi.com/api/scrape/
  • http://www.readability.com/developers/api
  • http://www.diffbot.com/

这将帮助您了解足够的空间,以便您能够更好地搜索您的问题域。

我想你可以在Mashape (http://www.mashape.com/)上找到一些相关的服务。

搜索"text"。像这样:https://www.mashape.com/search?query=text

有几个NLP/Analysis提供商,其中大多数是免费的。

OTOH,还有一个项目叫做锅炉管道。您可以在下面的URL中测试其质量:

http://boilerpipe-web.appspot.com/