我如何像这个网站一样提取博客文章
How do I extract the blog posts like this site did?
这个网站建立在Ning上。您会注意到他们在主页上设置了jQuery选项卡,并且查看源代码,您会发现这些选项卡从外部URL获取其内容(如下所示):
<div class="ui-tabs" id="tabs">
<ul>
<li><a href="http://friendsorenemies.com/vip/blog/embedPromoted?pageSize=10">Features</a></li>
<li><a href="http://friendsorenemies.com/vip/blog/embedVip?pageSize=10">Vip Blogs</a></li>
<li><a href="http://friendsorenemies.com/vip/blog/embedAll?pageSize=10">All</a></li>
</ul>
</div>
但是,这些网址对 Ning 来说并不是标准的(我尝试在类似的 Ning 博客网址上附加/vip/blog/embedPromoted?pageSize=10,但它不起作用),这让我相信它们是单独创建的,以某种方式提取博客文章。以下是关于Ning的博客页面的样子,以供参考:链接
有人知道他们如何仅使用博客文章创建这些页面吗?我最初想使用博客的 rss 提要,但意识到 rss 不包括作者头像和某些帖子元数据信息,例如我上面发布的第一个链接中的情况。
任何帮助将不胜感激。
提前感谢大家!
该 Ning
站点上的 /vip
URL 是 Ning 用于托管自定义 PHP 代码时的自定义功能。由于这是一项自定义功能,因此在其他网站上不可用。
可以使用 Ning API 创建类似内容,将来自一组特定成员的博客内容聚合到单个 HTML 页面或 RSS 源中。它必须在外部服务器上实现。
查看 rssinclude.com 方便的方法,将RSS提要放入网站。
如果这不起作用,您可以使用 QueryPath 库从网站 jQuery 样式中获取 HTML,但使用的是 PHP。
你说的rss feeds don't include the author's avatar
是什么意思?它包含在您在 OP 中的链接中。
可以实现的一种方法是,他们将XSLT模板应用于RSS提要以构建HTML页面。
相关文章:
- 在数据提取完成之前进行页面渲染
- 使用向下箭头键(与tab键一样)聚焦下一个输入
- 如何在Javascript中从字符串中提取某些单词
- RegEx JavaScript:数字后的符号提取
- 如何在内联依赖项并将图像转换为dataURI的情况下完全提取网页
- Regex提取URL返回数组的一部分;未定义”;
- 如何提取“;href"最近列表项中的属性值
- 使用时刻.js从日期时间中提取时间
- 通过javascript从会话中提取用户名
- HTML页面如何提取通过表单传递的参数
- 是否可以自动拉取“随机”;标签“;从一长串文本中提取
- innerHTML的子字符串可以在初始调用时提取吗
- 在SVG地图上添加水的渐变,就像在谷歌地图(PHP/JS)中一样
- 如何使用phonegap从安卓设备中提取联系人的字母顺序
- 如何从特定页面中提取php变量值
- 从字符串中提取年份的Javascript正则表达式
- 如何使用JavaScript提取此url的一部分
- 如何像模糊图像一样模糊iframe
- FullCalendar:事件发生时阻止重叠.标题是一样的
- 我如何像这个网站一样提取博客文章