为什么Googlebot从仅限JSON的网址请求HTML
Why is Googlebot requesting HTML from JSON-only URLs?
在这样的页面上:https://medstro.com/groups/nejm-group-open-forum/discussions/61
我有这样的代码:
$.getJSON("/newsfeeds/61?order=activity&type=discussion", function(response) {
$(".discussion-post-stream").replaceWith($(response.newsfeed_html));
$(".stream-posts").before($("<div class=''newsfeed-sorting-panel generic-12'' data-id=''61''>'n<div class=''newsfeed-type-menu generic-12''>'n<ul class=''newsfeed-sorting-buttons''>'n<li>'n<span>'nShow'n<'/span>'n<'/li>'n<li>'n<select id='"type'" name='"type'"><option selected='"selected'" value='"discussion'">Show All (15)<'/option>'n<option value='"discussion_answered'">Answered Questions (15)<'/option>'n<option value='"discussion_unanswered'">Unanswered Questions (0)<'/option><'/select>'n<'/li>'n<'/ul>'n<'/div>'n<'/div>'n"));
Newsfeed.prepare_for_newsfeed_sort($(".newsfeed-sorting-panel"));
});
Googlebot已经决定,它想看看/newsfeeds/61?order=activity&type=discussion
是否有任何有趣的HTML。因此,它会尝试抓取请求 HTML 的 URL,并且我的应用程序报告了错误。"ActionView::Missing Template: Missing template newsfeeds/show..."
- 为什么 Googlebot 会尝试抓取此网址?仅仅因为它认为那里有可能有一些有趣的东西并试图抓取所有东西?还是因为我的代码有问题?
- 在 Rails 中处理这个问题的最佳方法是什么?我不想忽略所有 Missing Template 错误,因为在某些情况下可能会预示着真正的错误。忽略机器人创建的错误也是如此。我还有其他选择吗?
据推测,它从页面源解析了该URL,并且只是试图抓取您的网站。
最好告诉 Google 抓取/不抓取哪些内容,方法是使用您网站的站点地图.xml文件和 robots.txt 文件。
您可以告诉 Googlebot 不要在漫游器中抓取具有以下(或任何)GET 参数的网页.txt:
Disallow: /*?
机器人试图在您的页面中查找新链接并没有错。他们正在做他们的工作。
也许您可以在视图中使用以下元标记之一:有没有办法让机器人忽略某些文本?
这些元对谷歌机器人说"不要看这里"
<!--googleoff: all-->
$.getJSON("/newsfeeds/61?order=activity&type=discussion", function(response) {
$(".discussion-post-stream").replaceWith($(response.newsfeed_html));
$(".stream-posts").before($("<div class=''newsfeed-sorting-panel generic-12'' data-id=''61''>'n<div class=''newsfeed-type-menu generic-12''>'n<ul class=''newsfeed-sorting-buttons''>'n<li>'n<span>'nShow'n<'/span>'n<'/li>'n<li>'n<select id='"type'" name='"type'"><option selected='"selected'" value='"discussion'">Show All (15)<'/option>'n<option value='"discussion_answered'">Answered Questions (15)<'/option>'n<option value='"discussion_unanswered'">Unanswered Questions (0)<'/option><'/select>'n<'/li>'n<'/ul>'n<'/div>'n<'/div>'n"));
Newsfeed.prepare_for_newsfeed_sort($(".newsfeed-sorting-panel"));
});
<!--googleon: all>
相关文章:
- 回复'js'仅当请求有错误时(否则使用html)
- Ajax调用返回当前html页面,而不是请求的文件
- 防止“;jQuery(html)"防止触发浏览器请求图像和其他参考内容
- 将GET请求(HTML字符串)转换为完整的DOM对象
- http请求使用html而不是json进行响应
- 为什么我从浏览器修改html/js时会多次发送ajax请求
- html标头以在请求中发送回
- 如何将事件绑定到从AJAX请求注入的HTML
- 需要一种根据请求禁用HTML框架的方法
- 如何在Angularjs中模拟HTML表单请求
- 在html/javascript中请求撤消/重做事件
- 将所有angular2捆绑包包含在index.html中会使导入从内存获取数据,而不是再次从服务器请求数据
- nodejs-如何安全地将令牌从http获取请求传递到html页面
- 如何使用 HTML 图像请求将数据发送到服务器,或返回数据作为响应
- 为什么Googlebot从仅限JSON的网址请求HTML
- 使用 JavaScript 请求 HTML 页面(Angular 应用程序)
- 如何在 Rails 3 中使用 ajax 请求请求 html 页面
- PJAX:如何使后退按钮从服务器重新请求 HTML
- 通过Ajax请求html的合适术语是什么?
- 如何通过 JSON 请求 HTML 文件