使用 mate 标签来阻挡搜寻蜘蛛检索网页
你可以使用特定的标签去告知搜寻引擎机器人,不要去检索特定的网页内容。
如果你想要知道,如何去阻挡网页蜘蛛检索你全部的网站,可以阅读这篇文章(如何使用 robots.txt 的阻止搜寻引擎爬(抓取)你的网站?)
你也可以使用相同的标签,来命令搜寻机器人不要去扫描网页以及追踪网页连结。
这是一个很好用的标签,即使你只想尝试去限制整个网站的一个网页。
在 HTML 程式码中,'没有关注,没有索引'是基本的:
若要复制使用请将<>改为半形。
<HTML> <HEAD> <TITLE> ... </ TITLE> <META NAME =“ROBOTS”CONTENT =“NOINDEX,NOFOLLOW”> </ HEAD> </ HTML>
当使用标签时,有三个重点部分是需要牢记的。
1.如果他们愿意,网路机器人可以忽略标签,会忽略标签大多是不良的网路机器人,他们会扫描网路安全漏洞并利用它,或者是使用电子邮件收割机,让滥发邮件者抓取电子邮件。
2.NOFOLLOW 指令只是用于网页上的连结,如果搜寻机器人找到其它网页的连结,并且没有使用 NOFOLLOW,搜寻机器人会直接到达这个网页。
3.在这里的 NOFOLLOW 标签,是不同于 rel =“nofollow”属性,你可以设定在<a href>标签里。
撰写给搜寻机器人看的标签
像其它标签一样使用在 HTML,他们应该被放置在 HTML 程式码的部分,就如同范例上。
<META NAME =“ROBOTS”CONTENT =“NOINDEX,FOLLOW”>
让我们依照上面的例子再接再厉。
1.NAME 属性是使用”机器人”。
2.CONTENT 属性有四种不同的参数可以设定:
逗号分开参数是允许的,但是只有某些组合是有意义的,如果没有使用标签,对搜寻机器人的预设而言,是使用索引,请的,所以你不需要去指定,还是可以被抓取到。
<META NAME =“ROBOTS”CONTENT =“NOINDEX,FOLLOW”> <META NAME =“ROBOTS”CONTENT =“INDEX,NOFOLLOW”> <META NAME =“ROBOTS”CONTENT =“NOINDEX,NOFOLLOW”>
如果你需要进一步的了解,如何阻挡搜寻机器人检索你的网站,你可以观看这篇文章(如何使用 robots.txt 的阻止搜寻引擎爬(抓取)你的网站?)
本文为原创文章,版权归seo培训所有,欢迎分享本文,转载请保留出处!