我如何像这个网站一样提取博客文章

How do I extract the blog posts like this site did?

本文关键字:一样 提取 文章 何像这 网站      更新时间:2023-09-26

这个网站建立在Ning上。您会注意到他们在主页上设置了jQuery选项卡,并且查看源代码,您会发现这些选项卡从外部URL获取其内容(如下所示):

<div class="ui-tabs" id="tabs"> 
     <ul> 
          <li><a href="http://friendsorenemies.com/vip/blog/embedPromoted?pageSize=10">Features</a></li> 
          <li><a href="http://friendsorenemies.com/vip/blog/embedVip?pageSize=10">Vip Blogs</a></li> 
          <li><a href="http://friendsorenemies.com/vip/blog/embedAll?pageSize=10">All</a></li> 
     </ul>
</div>

但是,这些网址对 Ning 来说并不是标准的(我尝试在类似的 Ning 博客网址上附加/vip/blog/embedPromoted?pageSize=10,但它不起作用),这让我相信它们是单独创建的,以某种方式提取博客文章。以下是关于Ning的博客页面的样子,以供参考:链接

有人知道他们如何仅使用博客文章创建这些页面吗?我最初想使用博客的 rss 提要,但意识到 rss 不包括作者头像和某些帖子元数据信息,例如我上面发布的第一个链接中的情况。

任何帮助将不胜感激。

提前感谢大家!

该 Ning

站点上的 /vip URL 是 Ning 用于托管自定义 PHP 代码时的自定义功能。由于这是一项自定义功能,因此在其他网站上不可用。

可以使用 Ning API 创建类似内容,将来自一组特定成员的博客内容聚合到单个 HTML 页面或 RSS 源中。它必须在外部服务器上实现。

查看 rssinclude.com 方便的方法,将RSS提要放入网站。

如果这不起作用,您可以使用 QueryPath 库从网站 jQuery 样式中获取 HTML,但使用的是 PHP。

你说的rss feeds don't include the author's avatar是什么意思?它包含在您在 OP 中的链接中。

可以实现的一种方法是,他们将XSLT模板应用于RSS提要以构建HTML页面。