如何防止搜索引擎索引ajax生成的内容

How to prevent search engines from indexing ajax-generated content

本文关键字:ajax 何防止 搜索引擎 索引      更新时间:2023-09-26

不久前Google宣布,现在它的爬虫能够索引页面上ajax生成的内容(您只需要遵循一些规则)。但在我的情况下,我需要确保任何搜索引擎都不能抓取我的ajax生成的内容。问题是:
如何防止搜索引擎索引ajax生成的内容?


多谢了!

一个好的开始是阅读谷歌关于这个主题的文档。

如果您没有任何标签,那么只需像往常一样在robots.txt中屏蔽此页面。谷歌应该尊重这一点,但要记住,其他爬虫,尤其是那些不太知名的爬虫可能不会。

我想到的另一个想法是在AJAX请求上检查user-agent。但话又说回来,这并不能防止用户代理欺骗,所以仍然会有一部分rouge爬虫出来获取您的敏感内容。

你可能会找到一些其他的解决方案,也许是一种聪明的JavaScript黑客,这将阻止大多数爬虫下载你的内容,但这种方法永远不会是可靠的或可持续的,因为最终,有人承诺24/7做出更好的爬虫。

如果你的目标是绝对确保某些东西不被索引,那么不管它是不是AJAX都没关系。任何敏感数据都需要隐藏在某种身份验证或图灵测试(如Captcha)之后。