WordPress如何根据自己的需求编写和优化robots.txt文件

27f5e15b6af3223

首先我们要用的是robots.txt文件,那么什么是robots呢?

robots就是网站跟爬虫间的协议,用简单直接的 txt格式 文本方式告诉对应的爬虫被允许的权限,也就是说robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。

而robots.txt文件内,Disallow?禁止,Allow?允许。按需要增减即可。

一般人使用以下配置即可。

这段的意思也就是对所有的搜索引擎采取默认的态度,我没有不允许,也没有拒绝,爱爬不爬,但是目录是不允许你爬的!但由于交互经常用到文件,所以又单独允许出来。最后一句告诉搜索引擎,我的站点地图地址,你可以根据我的地图来快速爬取。

某些内容不希望国内的人搜到,可使用以下配置。

Disallow 为禁止,也就是说 User-agent 是百度、搜搜、搜狗、有道都不允许爬我的站,当然,你可以根据自己的需求进行加减,毕竟还有很多小蜘蛛是常人所不知的,所以你需要通过后台查看他的 User-agent 请求头来把它加进去,并设置为 Disallow 即可。这样的设置就不影响国外的搜索引擎收录。

但是如果搜索引擎不遵守那就得使用杀手锏,请查看文末进阶教程!

为什么这里会说弄一个“不怎么会优化的WordPress配置”呢?因为缙哥哥经常在群里听到“我*,昨天某某蜘蛛又把我服务器爬挂了……”之类的语言。所以,如果你不愿意或者不会去优化你的WordPress站点,那么你可以使用如下robots配置。

  • 这个是在默认的基础上配置的,是开启了传说中的5秒盾,不过这是蜘蛛5秒盾,就是告诉搜索引擎蜘蛛在每次抓取之前等待几秒钟。当然,你甚至可以设置10秒、30秒、9999999秒(不如屏蔽它算了)。
  • 或者是防止蜘蛛爬搜索,很多小伙伴不会优化 WordPress,访客或蜘蛛一搜索,CPU就爆满了,这时你可以通过升级你的服务器来进行解决,或者尝试去优化WordPress(这里建议阅读《WordPress菜鸟建站篇(总结归类)——从无到有,境无止尽!》进行优化,可解决该问题)。
  • 禁止爬取、、三兄弟是防止其他人未经授权查看您正在使用的WordPress版本等信息,这里你还可以对其重定向。
  • 、、这三兄弟是防止爬虫爬你的 rss订阅 内容,当然,你也可以直接在 WordPress 后台关闭 rss 订阅。一般来说,rss页面对于服务器要求不是很高,一般不用去设置,当然,如果你是个原创作者,担心被其他人复制采集,可以参考《让WordPress RSS/Feed订阅自定义延时发布推送》。
  • 是防止蜘蛛爬你的评论留言内容,如果你的站留言较多,并且没有设置内存缓存或者Nginx缓存的话,每个评论页面服务器都要生成一个页面,自然CPU负荷就高了。
  • 是防止附件内容,也就是WordPress媒体库内容。

简而言之、言而总之,一般人无需设置以上配置。实在需求再去配置,毕竟绝大多数站长想要的还是流量!哦,对了,记得把上面的 Sitemap 地址改成你自己的!

在你的文件里面加上一个防止百度收录快照的代码:

但是百度不一定遵守robots规则,可能依然收录,那就用下面的终极办法!

如果你用的是Nginx,以宝塔为例,在站点配置里插入以下代码:

按后保存即可(尽量重启下Nginx),如果提示出错请根据错误修改!这时候去站长工具测试一下效果,看是不是返回403代码。

本文内容来源于公开网络,出于传递信息之目的整理发布。原文版权归原作者所有,若涉及侵权请先提供版权后联系我们删除

(0)
WP之家WP之家
上一篇 2025年3月29日
下一篇 2025年3月29日

相关推荐

  • 哔哩哔哩怎么注销账号 哔哩哔哩账号注销方法

    哔哩哔哩怎么注销账号 哔哩哔哩账号注销方法,赶快一起来看看吧。 打开哔哩哔哩 首先需要用户打开哔哩哔哩,进入到主页面中,点击右下角我的功能选项,进入到我的页面中。 进入设置 在我的功能界面中,找到设置功能…

    2025年4月5日
  • [帐号共享] WIN10/11专业版零售密钥

    产品密钥:728VN-Q8HKP-MBM8H-DHT64-MWRC6 类型描述:Win 10 RTM Professional Retail 错误代码:0xC004C008 检测时间:2023-04-25 01:50:54 AM(UTC+08:00) 产品密钥:BDPN8-GD4BR-6WF2Y-QTBQ3-3PFC6 类型描述:Win 10 RT…

    教程资讯 2025年3月29日
  • 为什么中国禁止谷歌浏览器?(最详细解答)

    在国内,我们对于网络的使用其实比较多的,谷歌搜索引擎是谷歌的搜索产品,就像国内百度一样,用户可以在里面搜索内容。谷歌搜索引擎在中国禁止使用,因为谷歌的一些内容不能通过国内验证,所以中国不允许直接使用…

    教程资讯 2025年3月29日
  • 《快手》最新热榜排行2024年4月20日

    《快手》最新热榜排行2024年4月20日,不少小伙伴想要知道快手每日排行榜,感兴趣的来wp之家找寻更多答案。 《快手》最新热榜排行2024年4月20日 1戚薇和蔡文静的双向奔赴1.34千万 2网友实拍广东暴雨1.32千万 3苏州KS…

    2025年4月5日
  • 夸克怎么添加窗口 夸克浏览器添加新窗口方法

    夸克怎么添加窗口 夸克浏览器添加新窗口方法,下面将为大家介绍夸克浏览器添加新窗口的操作方法,不知道怎么弄的小伙伴可以跟小编一起来看看哦! 1、打开夸克浏览器,在软件首页点击下方的窗口按钮。 2、在窗口界面…

    2025年4月5日
  • 快手怎么分享链接给别人 快手分享链接方法

    快手怎么分享链接给别人 快手分享链接方法,下面小编就为大家带来了快手分享链接的方法介绍,还不知道在哪里复制链接分享的小伙伴们可以跟小编一起来了解下哦! 1、打开快手,点击分享图标。 2、选择要分享的好友,…

    2025年4月5日
  • 夸克浏览器量子模式如何设置

    夸克浏览器量子模式如何设置,一起来看看吧。 1、打开浏览器,点击下方的设置。 2、选择上方的设置。 3、找到【夸克实验室】一栏,点击进入。 4、选择下图的量子模式。 5、点击量子模式即可开启。 以上就是wp之家小…

    2025年4月5日
  • 夸克云盘怎么搜索种子 夸克网盘快速搜索内容方法

    夸克云盘怎么搜索种子 夸克网盘快速搜索内容方法,感兴趣的小伙伴一起来看看吧。 打开夸克浏览器。 点击网盘按钮。 点击搜索按钮进入。 选择分类搜索即可。 以上就是wp之家小编整理的夸克云盘怎么搜索种子 夸克网盘…

    2025年4月5日