背景说明
基于starRocks官方文档,对其内容进行一定解析,方便大家理解和使用。
若无特殊标注,startRocks版本是3.2。
下面的章节和官方文档保持一致。
参考文档
产品简介 | StarRocks
StarRocks
StarRocks 是一款高性能分析型数据仓库,使用向量化、MPP 架构、CBO、智能物化视图、可实时更新的列式存储引擎等技术实现多维、实时、高并发的数据分析。StarRocks 既支持从各类实时和离线的数据源高效导入数据,也支持直接分析数据湖上各种格式的数据。StarRocks 兼容 MySQL 协议,可使用 MySQL 客户端和常用 BI 工具对接。同时 StarRocks 具备水平扩展,高可用、高可靠、易运维等特性。广泛应用于实时数仓、OLAP 报表、数据湖分析等场景。
内容 | 说明 |
---|---|
高性能分析型数据仓库 | 相比于oltp,更适合olap |
向量化 | 基于CPU层级的优化(clickhouse有相关优化) |
MPP 架构 | 相比于hadoop架构更适合olap |
CBO | 优化多表join的执行时,starRocks内部的执行先后顺序 |
智能物化视图 | 用于实现单表的实时数据转换,类似clickhouse的物化视图 |
可实时更新的列式存储引擎 | 可支持实时update |
兼容 MySQL | 可使用mysql相关语法和client工具 |
产品介绍
什么是 StarRocks
新一代极速全场景 MPP (Massively Parallel Processing) 数据库
数据分析变得更加简单和敏捷
查询速度(尤其是多表关联查询)远超同类产品
上述是描述中的关键词,可以看出来starRocks的定位。功能比较完成的MPP数据库,在多表关联有优势,其他方面至少持平。
适用场景:olap多维分析、实时数据仓库、高并发查询、统一分析
系统架构
这里暂时不展开说,就是两种模式。正常就是存算一体,就是starRocks还是标准的数据库。3.0以后支持存算分离,就是starRocks只是作为计算框架,已经不是正常的数据库了。
产品特性
这里的内容和最开始的说明差不多。多出来的数据湖分析,相当于存算分离的应用的场景。
- MPP 分布式执行框架
- 全面向量化执行引擎
- 存储计算分离
- CBO 优化器
- 可实时更新的列式存储引擎
- 智能的物化视图
- 数据湖分析
快速开始
使用 Docker 部署 StarRocks
不是一个标准安装,只是入门使用,用于尝试下面的创建表、导入和查询数据。
只安装了一个FE和BE,简单说不是集群模式。
创建表
从登录、创建数据库、创建表、修改表等常用功能都包含,可以用来熟悉。
导入和查询数据
提供5种导入方式,以及简单查询。
项目协助
社区聊天
指向starrocks.slack.com
部署StarRocks
前期准备
说明需要的CPU、内存、存储、网络、操作系统等信息,以及FE、BE、CN的配置说明。
环境检查的相关的命令,以及如何获取部署文件。
存算一体模式部署
三种安装模式。一是手动自己安装,二是基于starRocks的管理工具,三是基于k8s的管理工具。
存算分离模式部署
基于不同存储介质的部署,包含S3、GCS、Blob、MinIO、HDFS等。文章来源:https://www.toymoban.com/news/detail-823108.html
后期管理
部署后的设置信息。
如何升级和回滚版本。文章来源地址https://www.toymoban.com/news/detail-823108.html
到了这里,关于【技术预研】StarRocks官方文档浅析(1)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!