网站优化之robots.txt

这篇具有很好参考价值的文章主要介绍了网站优化之robots.txt。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

本文于2015年底完成,发布在个人博客网站上。
考虑个人博客因某种原因无法修复,于是在博客园安家,之前发布的文章逐步搬迁过来。


在查询favicon.ico相关的资料时,无间中看到了robots.txt。当时没有太注意,后来在百度的站长平台上看到了robots.txt的说明,咨询了度娘,找到几处说明,这里摘抄过来。

robots.txt文件是一个文本文件,使用任何一个常见的文本编辑器,比如Windows系统自带的Notepad,就可以创建和编辑它。

robots.txt是一个协议,而不是一个命令。robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。

当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。

百度官方建议,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。

如果将网站视为酒店里的一个房间,robots.txt就是主人在房间门口悬挂的“请勿打扰”或“欢迎打扫”的提示牌。这个文件告诉来访的搜索引擎哪些房间可以进入和参观,哪些房间因为存放贵重物品,或可能涉及住户及访客的隐私而不对搜索引擎开放。但robots.txt不是命令,也不是防火墙,如同守门人无法阻止窃贼等恶意闯入者。


参考资料文章来源地址https://www.toymoban.com/news/detail-777357.html

  • 如何使用robots.txt及其详解

到了这里,关于网站优化之robots.txt的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Ubuntu下面创建文本文档.txt

    第一步:在 主目录 下找到 模板 文件夹; 第二步::在 模板 文件夹下右键(选择 在终端中打开 ) 第三步:在终端中输入: sudo gedit 新建文本文档.txt ,然后输入密码即可; 第四步:在新建文本文档.txt右上角点击保存即可; 第五步:即可在任意位置新建文本文档.txt

    2024年02月13日
    浏览(39)
  • 免费搭建个人博客:零成本实现网站发布,无需域名和服务器

    估计每个开发者想拥有属于自己的个性化博客网站,但却担心域名和服务器费用 还有那些头痛的服务器费配置,现在我们可以可以在几分钟内拥有的博客网站,并且无需支付任何域名和服务器费用 本文推荐的建站方案核心就是:hugo  Hugo,一个快速、简单且功能强大的静态网站生

    2024年04月26日
    浏览(48)
  • 右键新建没有TXT文本文档的解决办法

    案例:Windows11 家庭中文版桌面右键新建没有TXT文本文档 Windows键/开始–设置–应用–可选功能–添加可选功能–记事本打钩–安装; 如果没有记事本,那可能已经安装了记事本,可以参考第2步,直接修改注册表。 一般都会默认安装的,都可以直接跳到第2步。 Windows Registr

    2024年02月14日
    浏览(44)
  • 搭建网站 --- 快速WordPress个人博客并内网穿透发布到互联网

    我们能够通过cpolar完整的搭建起一个属于自己的网站,并且通过cpolar建立的数据隧道,从而让我们存放在本地电脑上的网站,能够为公众互联网的用户访问。大量的测试和试运行,难免让人觉得眼花缭乱。今天,我们就抛开纷繁复杂的过程,仅从建站所需的工具,以及主要经

    2024年02月15日
    浏览(47)
  • 《前端与SEO》—— 第三章:robots.txt

    robots.txt 文件是网站对搜索引擎抓取工具 1 的抓取行为的规则声明。robots.txt文件中写明了 什么搜索引擎抓取工具可以做什么事 。它就类似于学校的学生行为规范。 robots.txt 主要用于限制抓取工具对资源访问 。例如不想让抓取工具抓取不重要或者相似的网页。 robots.txt 除了可

    2024年02月10日
    浏览(30)
  • UG导出点集坐标到txt文本文档中

    将UG中的离散的点或者点集坐标导出到文本文档; 原文地址 俩文件链接如下,失效了可以私信我要; 第一个是个exe,运行后是段操作录屏,可以不用下载,操作详情可见下文;第二个文件是需要选择的.grx格式文件,使用详情见下文 https://pan.baidu.com/share/init?surl=5ctC5YbDJlMKqP6

    2023年04月19日
    浏览(39)
  • 使用树莓派搭建个人网站,并发布到外网可访问:实用步骤解析

    这非常适合设置您的第一个网站,不仅可以学习管理 wordpress 站点,还可以学习 Linux。您将需要一个树莓派(Raspberry Pi)、几个小时和一台计算机来下载映像。 树莓派(RPI) 是学习这些东西的完美设备。 下载适用于您的操作系统的树莓派镜像工具。它支持大多数操作系统(Window

    2024年02月09日
    浏览(40)
  • 解决win10下桌面右击新建没有文本文档(.txt)的问题

    新建reg.txt 双击打开

    2024年02月09日
    浏览(64)
  • robots.txt 如何禁止蜘蛛(百度,360,搜狗,谷歌)搜索引擎获取页面内容

    什么是蜘蛛抓取 搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做robots.txt的纯文本文件。您可以在您的网站中创建一个纯文本文件robots.txt,在文件中声明该网站中不想被robot访问的部分或

    2024年02月14日
    浏览(57)
  • ChatGPT商业网站源码/支持GPT4.0/ai绘画(MJ绘画模型)/用户会员套餐+支持个人收款/赚取收益/实时语音识别输入/文章资讯发布功能/邀请分佣功能/后台一键版本更新!

    程序已支持ChatGPT4.0、Midjourney绘画、GPT3.5 绘画、语音识别输入、文章资讯发布功能、用户每日签到功能+一键更新版本。支持手机电脑不同布局页面自适应。 1、提问:程序已经支持GPT3.5、GPT4.0接口 2、支持三种Ai绘画模型(Midjourney模型、GPT3.5绘画、其他绘画模型) 3、中英文实

    2024年02月10日
    浏览(62)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包