网站服务器如何防止恶意爬虫抓取

1年前分类：Toy博客阅读(7)违法举报

这篇具有很好参考价值的文章主要介绍了网站服务器如何防止恶意爬虫抓取。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

恶意的蜘蛛行为不光会造成服务器的压力，并且对seo没有实质性用处，下面就拿SemrushBot蜘蛛为例来说明如何防止恶意爬取

SemrushBot蜘蛛原型

SemrushBot蜘蛛爬虫UA："Mozilla/5.0 (compatible; SemrushBot/6~bl; +http://www.semrush.com/bot.html)"

为什么要屏蔽SemrushBot蜘蛛抓取

1、SemrushBot蜘蛛抓取过多增加网站服务器负担

2、SemrushBot不会给网站带来实质性帮助

SemrushBot蜘蛛爬虫屏蔽：通过robots.txt

User-Agent: SemrushBot

Disallow: /

注意：但是很多爬虫对robots.txt视若罔闻，照样来爬取本站的内容，那我们就从服务器端来屏蔽爬取的爬取

apache服务器通过.htaccess来屏蔽

RewriteCond %{HTTP_USER_AGENT} ".*(SemrushBot|GoogleBot).*" [OR]文章来源地址https://www.toymoban.com/news/detail-409512.html

ngnix服务器通过伪静态来屏蔽

#禁止Scrapy等工具的抓取
if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) {
     return 403;
}
#禁止指定UA及UA为空的访问
if ($http_user_agent ~* "FeedDemon|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Cont

到了这里，关于网站服务器如何防止恶意爬虫抓取的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

如何防止机器人或者爬虫访问自己的网站
在网站的robots.txt文件中设置禁止机器人访问的页面或目录。 Robots.txt是一个文本文件，用于告诉搜索引擎哪些页面或目录不应该被访问。可以通过在robots.txt文件中添加\\\"Disallow\\\"指令来告诉机器人禁止访问某些页面或目录。例如：上述例子中，我们禁止了所有机器人访问/admin
2024年02月12日
浏览(7)
网站如何部署到阿里云服务器教程
上一节课讲解了将网站部署到本地服务器，这样通过局域网就可以访问网站了。这节课讲解将网站部署到阿里云服务器上，这样不必受限于局域网，在任何能上网的地方，都可以访问我们的个人简历网站了。为何要部署到云服务器上在云服务器出现以前，要发布部署一个网站
2024年02月05日
浏览(7)
如何通过优化服务器提升网站的SEO排名
在当今数字化时代，拥有一个高效、稳定的服务器对于网站的成功至关重要。然而，服务器不仅仅是为了提供网站的基本运行，它还可以对搜索引擎优化(SEO)起到关键作用，于是就有了多IP站群服务器这样对SEO非常友好的服务器。通过优化服务器设置和配置，可以提升网站的性
2024年02月07日
浏览(15)
如何使用宝塔面板搭建网站（Linux服务器配置篇）
搭建网站我们需要：必须是Linux服务器（最低要求配置1核1G当然再低些也能运行但是不建议）自己的域名（可以去阿里云或者腾讯云了解） PHP项目此处展示的是华为云服务器（各个服务器的购买和使用差别不大，这里提供参考）登录之后点击控制台点击右上角的搜索
2024年02月07日
浏览(31)
腾讯云服务器天天被ddos恶意攻击
大家都知道，腾讯云服务器是除了阿里云之外用户基数最多的云服务器商，当然也就会有不少的ddos等恶意攻击啦，所以今天就给大家讲讲腾讯云服务器天天被攻击怎么办 • 实现与边缘路由器之间的速率限制。这将限制每个IP可以做的损害。 • 如果可能，利用上游路
2024年02月13日
浏览(6)
腾讯云2核4G服务器性能如何？能安装几个网站？
腾讯云2核4G服务器能安装多少个网站？2核4g配置能承载多少个网站？一台2核4G服务器可以安装多少个网站？阿腾云2核4G5M带宽服务器目前安装了14个网站，从技术角度是没有限制的，只要云服务器性能够用，想安装几个网站就安装几个网站，但是从公网带宽和CPU计算性能方面考
2024年02月16日
浏览(6)
IIS如何本地部署网站，作为局域网内的服务器
可以类推此方法，将写好的Web部署到云服务器上，通过公网IP访问，就成功对整个互联网世界发布自己的网站啦！ PDA使用的是 Win CE 5.0的嵌入式系统，较老，而我们使用的数据库是SQL Server2016，较新，两者不能直接进行数据交互，需要一个中间件（WebService）牵线搭桥 . 图片说
2024年01月15日
浏览(34)
6步教你封杀恶意登录服务器的ip
Jun 5 10:25:56 localhost sshd[10165]: pam_unix(sshd:session): session opened for user root by (uid= Jun 5 10:25:59 localhost sshd[10184]: Accepted password for root from 192.168.10.1 port 58528 ssh2 Jun 5 10:25:59 localhost sshd[10184]: pam_unix(sshd:session): session opened for user root by (uid= Jun 5 12:51:19 localhost sshd[10394]: Accepted password for r
2024年04月28日
浏览(5)
iis配置网站服务器配置端口,如何实现IIS多个网页同一个端口？
在Internet Information Services (IIS) 中配置多个网站共用同一个端口是可能的，但需要进行一些特定的配置。以下是实现这一目标的一般步骤：创建多个网站：首先，您需要在 IIS 中创建多个不同的网站。每个网站应该有自己的根目录和内容。绑定共享端口：在每个网站的配置中
2024年02月13日
浏览(30)
【IIS搭建网站】如何使用本地电脑做服务器搭建web站点并公网访问
目录前言 Windows网页设置 Windows IIS功能设置 IIS网页访问测试 Cpolar内网穿透下载安装Cpolar Cpolar云端设置 3.3 Cpolar本地设置公网访问测试结语在网上各种教程和介绍中，搭建网页都会借助各种软件的帮助，比如网页运行的Apache和Nginx、数据库软件MySQL和MSSQL之类，为方便用户使
2023年04月14日
浏览(33)