一、ElasticSearch介绍
ES是一款非常强大的开源搜索引擎,可以帮我们从海量的数据中快速找到我们需要的内容。
ElasticSearch结合kibana、Logstash、Beats,也就是elastic stack(ELK),被广泛运用在日志数据分析,实时监控等领域。
ES负责数据 存储、计算、搜索数据。
LogStash和Beats负责 数据抓取。
Kibana 是数据可视化组件。
Lucence是ES的底层开发,java语言搜索引擎类库,是Apache公司顶级项目。
Lucence优势:
- 易扩展。
- 高性能。(基于倒排索引)
缺点:
- 只限于java语言开发。
- 学习难度高,曲线陡峭。
- 不支持水平扩展。
于是在lucence的基础上,ES优点:
- 支持分布式,可水平扩展。
- 提供restful接口,被任何语言调用。
什么是ElasticSearch?
一个开源的分布式搜索引擎,可以实现日志搜索,日志统计,分析等。
什么是ElasticSearch Stack(ELK)?
是以es为核心,logStash和beats负责数据抓取,kibana数据可视化的技术栈。
二、索引
传统数据库采用 正向索引,而es采用 倒排索引。
如mysql采用正向索引,比如一个表里有id,这个自增id就属于主键索引,也属于正向索引,查询非常快。
但如果查询某个字段,这个字段叫title其中存储着“明朝那些事”,这时候如果想查包含“那些”的title怎么查询呢,即使title有索引,这时候用模糊查询也会索引失效。
ElasticSearch采用倒排索引,倒排索引有两个概念,文档和词条。
- 文档(document):每条数据就是一个文档。
- 词条(term):文档按照语义分成的词语。
词条的唯一性保证不会重复,对词条创建索引。
查询“华为手机”的过程:
- 先拆分这个搜索为词条“华为”“手机”。
- 在倒排索引通过词条创建的主键索引,快速找到“手机”对应id为1,2,“华为”对应id为2,3。
- 文档id1,2,3可以查询到对应的三条数据,通过聚簇索引快速查询到结果集。
为什么叫倒排索引呢,因为平时数据库我们是先通过id去找具体的值,而es的倒排索引我们通过次创建新的索引,所以先是去找值再找对应索引的具体值。
三、ES与mysql对比
文档:
ElasticSearch是面向文档存储,可以是数据库一条商品或者一个订单信息。会被序列化成JSON格式存储。
索引(index):
会把类型相同的索引放在一起,比如商品索引,用户索引,订单索引等。
- Mysql的table 对比与 es的索引index
索引就是文档的集合,类似与数据库的表。
- mysql的row对比与es的document
Document是json风格,row是一条条数据。
Mysql擅长事务,数据库一致性和安全。文章来源:https://www.toymoban.com/news/detail-643909.html
Es擅长海量数据搜索和计算。文章来源地址https://www.toymoban.com/news/detail-643909.html
到了这里,关于分布式搜索ElasticSearch-ES(一)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!