网站服务器 如何防止恶意爬虫抓取

这篇具有很好参考价值的文章主要介绍了网站服务器 如何防止恶意爬虫抓取。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

恶意的蜘蛛行为不光会造成服务器的压力,并且对seo没有实质性用处,下面就拿SemrushBot蜘蛛为例来说明如何防止恶意爬取

SemrushBot蜘蛛原型

SemrushBot蜘蛛爬虫UA:"Mozilla/5.0 (compatible; SemrushBot/6~bl; +http://www.semrush.com/bot.html)"

为什么要屏蔽SemrushBot蜘蛛抓取

1、SemrushBot蜘蛛抓取过多增加网站服务器负担

2、SemrushBot不会给网站带来实质性帮助

SemrushBot蜘蛛爬虫屏蔽:通过robots.txt

User-Agent: SemrushBot

Disallow: /

注意:但是很多爬虫对robots.txt视若罔闻,照样来爬取本站的内容,那我们就从服务器端来屏蔽爬取的爬取

apache服务器通过.htaccess来屏蔽

RewriteCond %{HTTP_USER_AGENT} ".*(SemrushBot|GoogleBot).*" [OR]文章来源地址https://www.toymoban.com/news/detail-409512.html

ngnix服务器通过伪静态来屏蔽

#禁止Scrapy等工具的抓取
if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) {
     return 403;
}
#禁止指定UA及UA为空的访问
if ($http_user_agent ~* "FeedDemon|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Cont

到了这里,关于网站服务器 如何防止恶意爬虫抓取的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 如何防止机器人或者爬虫访问自己的网站

    在网站的robots.txt文件中设置禁止机器人访问的页面或目录。 Robots.txt是一个文本文件,用于告诉搜索引擎哪些页面或目录不应该被访问。可以通过在robots.txt文件中添加\\\"Disallow\\\"指令来告诉机器人禁止访问某些页面或目录。例如: 上述例子中,我们禁止了所有机器人访问/admin

    2024年02月12日
    浏览(49)
  • 网站如何部署到阿里云服务器教程

    上一节课讲解了将网站部署到本地服务器,这样通过局域网就可以访问网站了。这节课讲解将网站部署到阿里云服务器上,这样不必受限于局域网,在任何能上网的地方,都可以访问我们的个人简历网站了。为何要部署到云服务器上在云服务器出现以前,要发布部署一个网站

    2024年02月05日
    浏览(62)
  • 如何通过优化服务器提升网站的SEO排名

    在当今数字化时代,拥有一个高效、稳定的服务器对于网站的成功至关重要。然而,服务器不仅仅是为了提供网站的基本运行,它还可以对搜索引擎优化(SEO)起到关键作用,于是就有了多IP站群服务器这样对SEO非常友好的服务器。通过优化服务器设置和配置,可以提升网站的性

    2024年02月07日
    浏览(97)
  • 如何使用宝塔面板搭建网站(Linux服务器配置篇)

    搭建网站我们需要: 必须是Linux服务器 (最低要求配置1核1G当然再低些也能运行但是不建议) 自己的域名(可以去阿里云或者腾讯云了解) PHP项目   此处展示的是华为云服务器 (各个服务器的购买和使用差别不大,这里提供参考) 登录之后点击控制台  点击右上角的搜索

    2024年02月07日
    浏览(73)
  • 腾讯云服务器天天被ddos恶意攻击

    大家都知道,腾讯云服务器是除了阿里云之外用户基数最多的云服务器商,当然也就会有不少的ddos等恶意攻击啦,所以今天就给大家讲讲腾讯云服务器天天被攻击怎么办     • 实现与边缘路由器之间的速率限制。这将限制每个IP可以做的损害。     • 如果可能,利用上游路

    2024年02月13日
    浏览(54)
  • IIS如何本地部署网站,作为局域网内的服务器

    可以类推此方法,将写好的Web部署到云服务器上,通过公网IP访问,就成功对整个互联网世界发布自己的网站啦! PDA使用的是 Win CE 5.0的嵌入式系统,较老,而我们使用的数据库是SQL Server2016,较新,两者不能直接进行数据交互,需要一个中间件(WebService) 牵线搭桥 . 图片说

    2024年01月15日
    浏览(64)
  • 腾讯云2核4G服务器性能如何?能安装几个网站?

    腾讯云2核4G服务器能安装多少个网站?2核4g配置能承载多少个网站?一台2核4G服务器可以安装多少个网站?阿腾云2核4G5M带宽服务器目前安装了14个网站,从技术角度是没有限制的,只要云服务器性能够用,想安装几个网站就安装几个网站,但是从公网带宽和CPU计算性能方面考

    2024年02月16日
    浏览(46)
  • 6步教你封杀恶意登录服务器的ip

    Jun 5 10:25:56 localhost sshd[10165]: pam_unix(sshd:session): session opened for user root by (uid= Jun 5 10:25:59 localhost sshd[10184]: Accepted password for root from 192.168.10.1 port 58528 ssh2 Jun 5 10:25:59 localhost sshd[10184]: pam_unix(sshd:session): session opened for user root by (uid= Jun 5 12:51:19 localhost sshd[10394]: Accepted password for r

    2024年04月28日
    浏览(29)
  • 【IIS搭建网站】如何使用本地电脑做服务器搭建web站点并公网访问

    目录 前言 Windows网页设置 Windows IIS功能设置 IIS网页访问测试 Cpolar内网穿透 下载安装Cpolar Cpolar云端设置 3.3 Cpolar本地设置 公网访问测试 结语 在网上各种教程和介绍中,搭建网页都会借助各种软件的帮助,比如网页运行的Apache和Nginx、数据库软件MySQL和MSSQL之类,为方便用户使

    2023年04月14日
    浏览(87)
  • iis配置网站服务器配置端口,如何实现IIS多个网页同一个端口?

    在Internet Information Services (IIS) 中配置多个网站共用同一个端口是可能的,但需要进行一些特定的配置。以下是实现这一目标的一般步骤: 创建多个网站: 首先,您需要在 IIS 中创建多个不同的网站。每个网站应该有自己的根目录和内容。 绑定共享端口: 在每个网站的配置中

    2024年02月13日
    浏览(78)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包