如何从其他人那里提取标题,图像'在自己的网站上发表博客文章
How to extract title, image from others' blog posts and publish on own site
我计划建立一个网站,在那里我可以分享我精心挑选的内容,我不能把我的头在不通过API获得这些数据输入到我的网站的基本想法。
我首先想到也许我应该检查我想要嵌入在我的网站上的页面的源HTML,并访问它与$('div.post').find('img').attr('src')
。但我无法想象自己每次都这样做,所以我想一定有更好的方法。
这就是Google+对他们的帖子所做的。一旦你添加了一个url链接,一秒钟后,它会从链接页面中提取有特色的图像和一些文本片段。
许多网站使用Open graph协议来获取任何url的元标题、元描述、图像等。
例如打开:viewsource:https://blog.kissmetrics.com/open-graph-meta-tags/并搜索"open Graph Protocol Meta"
它们包含在页面源代码中。您必须向您想要抓取的URL发送请求,并通过Regular Expr/HTML解析器读取适当的元标记。
你不能用javascript做到这一点。您需要一个服务器端脚本来下载所需的页面,然后使用DOM解析器对其进行解析。
使用PHP,您可以通过cURL获取一个URL的内容。
看到更多:http://php.net/manual/es/book.curl.php
相关文章:
- 如何在Facebook上分享我自己的网站与网站上的图像
- AngularJS'自己的网站提供SEO友好的页面
- 访问另一个网站后重定向回自己的网页
- 在自己的网站上禁用chrome上下文菜单选项
- 如何确保只有我自己的网站(客户端代码)可以与Firebase后端通信
- 在我自己的页面中从javascript打开一个网站
- 阻止我自己的网站设置(第三方)cookie
- 允许用户在网站中输入自己的位置(地址)
- 将动态网页(Kibana)的一部分嵌入到我自己的网站中
- 当通过disqus在网站上注册时,也注册这个用户拥有我自己的数据库
- 不能从我自己的网站调用steam api网站(安全问题)
- 可汗学院的计算机程序如何离线运行或在我自己的网站上运行
- 如何创建自己的交互式全景网站
- 如何从其他人那里提取标题,图像'在自己的网站上发表博客文章
- 使用JSAPI在我自己的网站中添加linkedIn连接作为朋友
- 从c#网站打开我自己的c#桌面应用程序
- 可能的:插入我自己的HTML(整个网站)到一个iframe
- 我需要保护我的网站从框架.在同一时间,我需要iframe我自己的网站和一些允许的网站.我怎么能这么做呢?
- 2013年,人们如何验证自己的网站?
- 我怎么能使用我自己的图像时,网站返回假图像与404响应代码