如何从Bing索引中获取网站页面?

本文介绍了网站管理员和网站所有者必须从Bing索引中删除其自己的网站中的URL的不同选项。

注意注意
如果您不是应从搜索结果中删除的页面的网站管理员或网站所有者,则应联系网站的网站管理员以删除内容。如果已经发生并且内容不再存在于网站上,则可以使用“ 内容删除工具”来请求从Bing搜索结果中删除页面。

方法1:从您的站点中删除页面并返回404

从我们的索引中删除URL的最自然的方法是从您的站点中删除该URL,以便该URL返回404(未找到)或410(已消失)HTTP状态。重新抓取该页面并确定该页面已从您的网站中永久删除后,我们将从搜索结果中删除该页面。请注意,为了使Bing检测到该页面实际上已从您的站点中删除,并现在返回404或410 HTTP状态代码,Bingbot需要能够访问该URL,因此您不应阻止该URL被访问。通过robots.txt重新抓取。

方法2:将NOINDEX元标记添加到页面

如果您需要根据选项1从Bing搜索结果中删除无法或不希望从网站中删除的URL,则可以将漫游器元标记添加到HTML源。Bing尊重meta robots标签,并在页面源代码中添加<meta name =“ robots” content =“ noindex”>,以确保页面在重新爬网和重新处理后将从索引中消失。使用NOINDEX标记时,您的HTML标头类似于:

<html><head><meta name="robots" content="noindex" />(…rest goes here…)</head><body>…</body></html>

请注意,重新爬网和重新处理可能需要一些时间。另外,请确保不要禁止使用robots.txt或其他方式对URL进行爬网:我们仍然需要能够提取该页面才能看到NOINDEX标签。

注意:如果您要从索引中删除的URL不是网页而是PDF,则可以选择向响应标头发X-Robots-Tag:noindex

HTTP/1.1 200 OKCache-Control: privateContent-Type: text/html; charset=utf-8X-Robots-Tag: noindex

方法3:使用“阻止URL”工具删除URL

如果您急于从搜索结果中获取URL,而又不能等待自然的抓取过程,则可以使用网站站长工具中的“ 阻止URL”工具来阻止URL。这样可以防止该网址在24小时内出现在搜索结果中。请注意,“阻止URL”仅阻止页面出现在搜索结果中,并且是临时的,因为它们每90天过期一次,但这应该使您有时间从站点中删除页面或向页面添加NOINDEX元标记,以便完全从我们的索引中删除它们。

发表评论

电子邮件地址不会被公开。 必填项已用*标注