优化记录 -- 记一次搜索引擎(SOLR)优化

这篇具有很好参考价值的文章主要介绍了优化记录 -- 记一次搜索引擎(SOLR)优化。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

业务场景

某服务根据用户相关信息,使用搜索引擎进行数据检索

软件配置

solr 1台:32c 64g 数据10gb左右,版本 7.5.5
应用服务器1台:16c 64g
应用程序 3节点

问题产生现象

1、因业务系统因处理能不足,对业务系统硬件平台进行升级,升级变更为 16c64g —> 32c64g 增加 16c
2、业务系统升级,处理能力增加,对原搜索引擎服务器的qps有所提升,原qps 1500 提升至 2600左右
3、搜索引擎负载发生极大变化,从原始负载60左右,提升至85左右,远超预期

分析问题

应用层:

链接数未提升,仅提升qps,应该不会对solr 造成过大的影响

SOLR 层

分析缓存

检查os 剩余内存

使用 htop 观测剩余内存还有将近30g,因此决定调整 solr 相关缓存配置
优化记录 -- 记一次搜索引擎(SOLR)优化,笔记,多线程,调试,搜索引擎,solr,lucene

分析 SOLR 线程栈

1、使用 jstack pid >pid.jstack 导出solr 线程运行情况
2、通过 IBM JCA469.jar 分析工具,检查线程锁
优化记录 -- 记一次搜索引擎(SOLR)优化,笔记,多线程,调试,搜索引擎,solr,lucene
发现500+线程等待log锁
优化记录 -- 记一次搜索引擎(SOLR)优化,笔记,多线程,调试,搜索引擎,solr,lucene
检查 solr 相关日志配置
发现 solr 7.5.5 使用 log4j2日志框架,且使用同步日志输出模式
优化记录 -- 记一次搜索引擎(SOLR)优化,笔记,多线程,调试,搜索引擎,solr,lucene

调整方案

增加SOLR缓存,提升缓存命中率

原始配置

  <filterCache class="solr.FastLRUCache"
                 maxRamMB="2048"
                 autowarmCount="150000"/>

    <queryResultCache class="solr.LRUCache"
                      size="65536"
                      initialSize="65536"
                      autowarmCount="0"/>

    <documentCache class="solr.LRUCache"
                   size="65536"
                   initialSize="65536"
                   autowarmCount="0"/>

更新后配置

  <filterCache class="solr.FastLRUCache"
                 maxRamMB="2048"
                 autowarmCount="150000"/>

    <queryResultCache class="solr.LRUCache"
                      size="131070"
                      initialSize="131070"
                      autowarmCount="0"/>

    <documentCache class="solr.LRUCache"
                   size="131070"
                   initialSize="131070"
                   autowarmCount="0"/>
                   

增加JVM 内存

Xmx16g ---> Xmx24g

使用全局异步日志打印日志输出

在 solr.in.sh 添加JVM启动参数

-Dlog4j2.contextSelector=org.apache.logging.log4j.core.async.AsyncLoggerContextSelector

调整后效果如下

os 负载情况

调整前
优化记录 -- 记一次搜索引擎(SOLR)优化,笔记,多线程,调试,搜索引擎,solr,lucene
调整后
优化记录 -- 记一次搜索引擎(SOLR)优化,笔记,多线程,调试,搜索引擎,solr,lucene

线程锁情况

优化记录 -- 记一次搜索引擎(SOLR)优化,笔记,多线程,调试,搜索引擎,solr,lucene
调整后
优化记录 -- 记一次搜索引擎(SOLR)优化,笔记,多线程,调试,搜索引擎,solr,lucene文章来源地址https://www.toymoban.com/news/detail-752334.html

到了这里,关于优化记录 -- 记一次搜索引擎(SOLR)优化的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【搜索引擎Solr】Solr:提高批量索引的性能

    几个月前,我致力于提高“完整”索引器的性能。我觉得这种改进足以分享这个故事。完整索引器是 Box 从头开始创建搜索索引的过程,从 hbase 表中读取我们所有的文档并将文档插入到 Solr 索引中。 我们根据 id 对索引文档进行分片,同样的文档 id 也被用作 hbase 表中的 key。

    2024年02月15日
    浏览(28)
  • 搜索引擎 ElasticSearch, Solr 简介

    作者:禅与计算机程序设计艺术 搜索引擎的功能就是帮助用户快速检索到需要的信息。搜索引擎通常由两个主要组成部分:查询解析器和索引器。查询解析器负责将用户输入的查询文本转换成可以搜索的形式;而索引器则是对网页、文档或者其他信息进行索引并存储在数据库

    2024年01月19日
    浏览(30)
  • Apache Solr搜索引擎开发框架

    为什么要学习搜索引擎开发框架 常见的搜索引擎框架: 1.Solr 2.ElasticSearch 搭建ELK环境(ElasticSearch+Logback+Kabana)实现日志系统的搭建 Solr是基于Apache Lucene构建的流行,快速,开源的企业搜索平台。 Solr具有高可靠性,可扩展性和容错性,可提供分布式索引,复制和负载均衡查询

    2024年02月05日
    浏览(27)
  • 【搜索引擎】提高Apache Solr 性能

    这是一个关于我们如何设法克服搜索和相关性堆栈的稳定性和性能问题的简短故事。 在过去的 10 个月里,我很高兴与个性化和相关性团队合作。我们负责根据排名和机器学习向用户提供“个性化和相关的内容”。我们通过一组提供三个公共端点的微服务来做到这一点,即

    2024年02月17日
    浏览(29)
  • 高可用的搜索引擎:Elasticsearch与Solr对比

    搜索引擎是现代互联网的基石,它使得我们可以在海量数据中快速找到所需的信息。高可用性是搜索引擎的核心需求,因为用户对于搜索结果的实时性和准确性有很高的要求。Elasticsearch和Solr是两个流行的搜索引擎,它们各自具有独特的优势和特点。在本文中,我们将对比这

    2024年02月20日
    浏览(25)
  • Lucene轻量级搜索引擎,Solr 和 ElasticSearch 都是基于 Lucene 的封装

    1、Lucene 是什么 Lucene 是一个本地全文搜索引擎,Solr 和 ElasticSearch 都是基于 Lucene 的封装 Lucene 适合那种轻量级的全文搜索,我就是服务器资源不够,如果上 ES 的话会很占用服务器资源,所有就选择了 Lucene 搜索引擎 2、倒排索引原理 全文搜索的原理是使用了倒排索引,那么什么是倒

    2024年03月15日
    浏览(57)
  • Lucene轻量级搜索引擎,真的太强了!!!Solr 和 ES 都是基于它

    Lucene 是一个本地全文搜索引擎,Solr 和 ElasticSearch 都是基于 Lucene 的封装 Lucene 适合那种轻量级的全文搜索,我就是服务器资源不够,如果上 ES 的话会很占用服务器资源,所有就选择了 Lucene 搜索引擎 全文搜索的原理是使用了倒排索引,那么什么是倒排索引呢? 先通过中文分词器,将文

    2024年03月11日
    浏览(51)
  • 《Spring Boot 实战派》--13.集成NoSQL数据库,实现Elasticsearch和Solr搜索引擎

             关于搜索引擎 我们很难实现 Elasticseach 和 Solr两大搜索框架的效果;所以本章针对两大搜索框架,非常详细地讲解 它们的原理和具体使用方法, 首先 介绍什么是搜索引擎 、如何用 MySQL实现简单的搜索引擎,以及Elasticseach 的 概念和接口类; 然后介绍Elasticseach

    2023年04月09日
    浏览(76)
  • Lucene和Solr和Elasticsearch区别,全文检索引擎工具包Lucene索引流程和搜索流程实操

    我们生活中的数据总体分为两种: 结构化数据和非结构化数据 。 结构化数据 :指具有固定格式或有限长度的数据,如数据库,元数据等。 非结构化数据 :指不定长或无固定格式的数据,如 互联网数据、邮件,word文档等。 非结构化数据又有一种叫法叫全文数据 按照数据的

    2024年02月03日
    浏览(34)
  • SEO搜索引擎优化

    SEO代表搜索引擎优化(Search Engine Optimization),是一种通过对网站进行优化来提高其在搜索引擎结果页面(SERP)中排名的过程和实践。通过使用SEO技术,网站所有者可以使其网站在搜索引擎中获得更高的可见性,从而增加流量和潜在客户。 搜索引擎优化的目标是理解好搜索引

    2024年02月12日
    浏览(72)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包