10倍提升效率,号称取代Elasticsearch?

这篇具有很好参考价值的文章主要介绍了10倍提升效率,号称取代Elasticsearch?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

[Manticore Search](https://github.com/manticoresoftware/manticoresearch/) 是一个使用 C++ 开发的高性能搜索引擎,创建于 2017 年,其前身是 Sphinx Search 。Manticore Search 充分利用了 Sphinx,显着改进了它的功能,修复了数百个错误,几乎完全重写了代码并保持开源。这一切使 Manticore Search 成为一个现代,快速,轻量级和功能齐全的数据库,具有出色的全文搜索功能。
官网

Manticore Search – easy-to-use open-source fast database for search

介绍

10倍提升效率,号称取代Elasticsearch?,elasticsearch,大数据,搜索引擎

  • 对于小型数据集,比Elasticsearch快15倍
  • 对于中等大小的数据,比Elasticsearch快5倍
  • 对于大型数据,比Elasticsearch快4倍
  • 在单个服务器上进行数据导入时,最大吞吐量比Elasticsearch快最多2倍

主要特点

强大而快速的全文搜索,适用于小型和大型数据集

超过20个全文运算符和超过20个排名要素

  • 自定义排名
  • 词干提取
  • 词形还原
  • 停用词
  • 同义词
  • 词形
  • 字符和单词级别的高级标记化
  • 正确的中文分词
  • 文本突出显示
多线程

Manticore Search 利用智能查询并行化来缩短响应时间并在需要时充分利用所有 CPU 核心。

基于成本的查询优化器

基于成本的查询优化器使用有关索引数据的统计数据来评估给定查询的不同执行计划的相对成本。这使得优化器能够确定检索所需结果的最有效计划,同时考虑索引数据的大小、查询的复杂性和可用资源等因素。

存储选项

Manticore 提供行式和列式存储选项,以适应各种大小的数据集。传统和默认的行存储选项适用于所有大小的数据集(小型、中型和大型),而列式存储选项则通过 Manticore 列式库提供,适用于更大的数据集。这些存储选项之间的主要区别在于,行式存储需要将所有属性(不包括全文字段)保留在 RAM 中以获得最佳性能,而列式存储则不需要,因此 RAM 消耗较低,但有可能会稍微降低性能。性能较慢(如https://db-benchmarks.com/上的统计数据所示)。

自动二级索引

Manticore Columnar Library使用分段几何模型索引,它利用了索引键与其在内存中的位置之间的学习映射。这种映射的简洁性,加上独特的递归构造算法,使得 PGM 索引成为一种在空间上以数量级优势统治传统索引的数据结构,同时仍然提供最佳的查询和更新时间性能。默认情况下,所有数字字段的二级索引均处于开启状态。

SQL优先

Manticore 的原生语法是 SQL,它支持 SQL over HTTP 和 MySQL 协议,允许通过任何编程语言的流行 mysql 客户端进行连接。

基于 HTTP 的 JSON

为了采用更具编程性的方法来管理数据和模式,Manticore 提供了HTTP JSON协议,类似于 Elasticsearch 的协议。

与 Elasticsearch 兼容的写入

您可以执行与 Elasticsearch 兼容的插入和替换JSON 查询,从而可以将 Manticore 与 Logstash(版本 < 7.13)、Filebeat 和 Beats 系列的其他工具等工具一起使用。

声明式和命令式模式管理

在线或通过配置文件轻松创建、更新和删除表。

C++ 的优点和 PHP 的便利

Manticore Search 守护进程是用 C++ 开发的,提供快速的启动时间和高效的内存利用率。低级优化的利用进一步提高了性能。另一个关键组件称为Manticore Buddy,它是用 PHP 编写的,用于实现不需要快速响应时间或极高处理能力的高级功能。尽管贡献 C++ 代码可能会带来挑战,但使用 Manticore Buddy 添加新的 SQL/JSON 命令应该是一个简单的过程。

实时插入

新添加或更新的文档可以立即阅读。

内置复制和负载平衡Built-In replication and load balancing

数据可以跨服务器和数据中心分布,任何 Manticore 搜索节点既充当负载均衡器又充当数据节点。Manticore使用Galera库实现虚拟同步多主,确保所有节点之间的数据一致性,防止数据丢失,并提供卓越的复制性能。

内置备份功能Built-in backup capabilities

Manticore 配备了外部工具和 SQL 命令来简化备份和恢复数据的过程。

开箱即用的数据同步Out-of-the-box data sync

Manticore 的工具和全面的配置语法可以轻松同步来自 MySQL、PostgreSQL、兼容 ODBC 的数据库、XML 和 CSV 等源的数据。文章来源地址https://www.toymoban.com/news/detail-649961.html

到了这里,关于10倍提升效率,号称取代Elasticsearch?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 互联网大厂技术-elasticsearch(es)- 在数据量很大的情况下(数十亿级别)提高查询效率

    互联网大厂技术-elasticsearch(es)- 在数据量很大的情况下(数十亿级别)提高查询效率 目录 一、问题分析 二、问题剖析 三、性能优化的杀手锏(filesystem cache) 四、数据预热 五、冷热分离 六、document 模型设计 七、分页性能优化 八、解决方案 这个问题是肯定要问的,说白了,就

    2024年02月04日
    浏览(65)
  • 10个免费的 AI 工具,提升工作效率(附网址)

    人工智能已经渗透到我们的日常生活中,但是,五花八门的AI工具可能会让人感到不知所措。所以我们精选了10个免费、用户友好的AI工具,它们既有效又实用,适合日常使用。 1.深度变换工具:DeepSwap的进化 DeepSwap,一款先进的AI工具,正迎来制作深度伪造视频和图像的新时代

    2024年01月21日
    浏览(35)
  • 让工作效率提升10倍:十大AIGC工具评测【建议收藏】

    AI技术的普及已经在近年来不断增长。这种技术已经改变了我们与电脑的互动方式,让我们能够更高效、更自然地完成任务。本文将展示10个基于ChatGPT和GPT-3 AI模型构建的最强大的资源,使您更容易充分利用它们的潜力。因此,如果您想利用AI技术改进生活或工作,这篇文章是

    2024年02月09日
    浏览(34)
  • Elasticsearch:提升 Elasticsearch 性能

    Elasticsearch 是为你的用户提供无缝搜索体验的不可或缺的工具。 在最近的 QCon 会议上,我遇到了很多的开发者。在他们的系统中,Elastic Stack 是不可缺少的工具,无论在搜索,可观测性或安全领域,Elastic Stack 都发挥着巨大的作用。我们在手机中常见的应用或者网站上的搜索基

    2023年04月08日
    浏览(26)
  • Bito AI——智能编程辅助软件,提升10倍开发效率!(New)

    目录 前言 [Bito News] Updates更新于2023-06-15 1、Bito融资320万美元,加速下一代版本的研发 2、支持自定义设置输出语言(超过17种语言) 3、IDE 上下文菜单中自定义模板 4、Bito CLI中引入上下文记忆 5、自定义模板(Prompt Templates) 6、标准模板可以修改或者删除吗?自定义模板可以

    2024年02月03日
    浏览(48)
  • 10年大数据专家,使用Flink实现索引数据到Elasticsearch,快来学

    使用Flink处理数据时,可以基于Flink提供的批式处理(Batch Processing)和流式处理(Streaming Processing)API来实现,分别能够满足不同场景下应用数据的处理。这两种模式下,输入处理都被抽象为Source Operator,包含对应输入数据的处理逻辑;输出处理都被抽象为Sink Operator,包含了

    2024年04月29日
    浏览(18)
  • ES常见问题(1)-解决ElasticSearch每次只能返回10条数据

    使用ElasticSearch查询分页数据 有时候,我们需要使用ElasticSearch来分词查询,并分页返回指定的数据条数,但是当我们每次想得到分页数据条数超过十条的时候,ElasticSearch总是只能返回十条 因为ElasticSearch为了查询的速度,在默认的情况下已经设置了分页数据只能返回10条,所

    2024年02月11日
    浏览(30)
  • 阿里又开发了一款 IDEA 新插件,开发效率提升了 10 几倍!好用到爆!!

    大家好,我是R哥。 昨天,我在我的《Java技术小密圈》知识星球分享了《 Java AI 辅助编程工具推荐 》: 帮我智能辅助写代码,开发效率至少提升了 10 倍,有兴趣的可以加入学习交流,持续分享技术干货,之前一直是 199 的,为了做大,目前 99 元优惠中,满 3000 人持续恢复原

    2024年02月01日
    浏览(49)
  • 【Elasticsearch专栏 03】深入探索:Elasticsearch的倒排索引是如何提高搜索效率的?

    倒排索引之所以能够提高搜索效率,关键在于其独特的构建方式和数据结构设计。下面,我将对倒排索引的工作原理进行深层解读,并阐述其如何显著提高搜索效率。 分词与索引构建 首先,搜索引擎会对文档内容进行分词处理,将文本拆分成独立的单词或词组。然后,为每

    2024年02月22日
    浏览(29)
  • ElasticSearch学习篇10_Lucene数据存储之BKD动态磁盘树

    基础的数据结构如二叉树衍生的的平衡二叉搜索树通过左旋右旋调整树的平衡维护数据,靠着二分算法能满足一维度数据的logN时间复杂度的近似搜索。对于大规模多维度数据近似搜索,Lucene采用一种BKD结构,该结构能很好的空间利用率和性能。 本片博客主要学习常见的多维

    2024年03月15日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包