【技术预研】StarRocks官方文档浅析(1)

这篇具有很好参考价值的文章主要介绍了【技术预研】StarRocks官方文档浅析(1)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

背景说明

基于starRocks官方文档,对其内容进行一定解析,方便大家理解和使用。
若无特殊标注,startRocks版本是3.2。
下面的章节和官方文档保持一致。

参考文档

产品简介 | StarRocks

StarRocks

StarRocks 是一款高性能分析型数据仓库,使用向量化、MPP 架构、CBO、智能物化视图、可实时更新的列式存储引擎等技术实现多维、实时、高并发的数据分析。StarRocks 既支持从各类实时和离线的数据源高效导入数据,也支持直接分析数据湖上各种格式的数据。StarRocks 兼容 MySQL 协议,可使用 MySQL 客户端和常用 BI 工具对接。同时 StarRocks 具备水平扩展,高可用、高可靠、易运维等特性。广泛应用于实时数仓、OLAP 报表、数据湖分析等场景。

内容 说明
高性能分析型数据仓库 相比于oltp,更适合olap
向量化 基于CPU层级的优化(clickhouse有相关优化)
MPP 架构 相比于hadoop架构更适合olap
CBO 优化多表join的执行时,starRocks内部的执行先后顺序
智能物化视图 用于实现单表的实时数据转换,类似clickhouse的物化视图
可实时更新的列式存储引擎 可支持实时update
兼容 MySQL 可使用mysql相关语法和client工具

产品介绍

什么是 StarRocks

新一代极速全场景 MPP (Massively Parallel Processing) 数据库
数据分析变得更加简单和敏捷
查询速度(尤其是多表关联查询)远超同类产品

上述是描述中的关键词,可以看出来starRocks的定位。功能比较完成的MPP数据库,在多表关联有优势,其他方面至少持平。
适用场景:olap多维分析、实时数据仓库、高并发查询、统一分析

系统架构

这里暂时不展开说,就是两种模式。正常就是存算一体,就是starRocks还是标准的数据库。3.0以后支持存算分离,就是starRocks只是作为计算框架,已经不是正常的数据库了。

产品特性

这里的内容和最开始的说明差不多。多出来的数据湖分析,相当于存算分离的应用的场景。

  • MPP 分布式执行框架
  • 全面向量化执行引擎
  • 存储计算分离
  • CBO 优化器
  • 可实时更新的列式存储引擎
  • 智能的物化视图
  • 数据湖分析

快速开始

使用 Docker 部署 StarRocks

不是一个标准安装,只是入门使用,用于尝试下面的创建表、导入和查询数据。
只安装了一个FE和BE,简单说不是集群模式。

创建表

从登录、创建数据库、创建表、修改表等常用功能都包含,可以用来熟悉。

导入和查询数据

提供5种导入方式,以及简单查询。

项目协助

社区聊天

指向starrocks.slack.com

部署StarRocks

前期准备

说明需要的CPU、内存、存储、网络、操作系统等信息,以及FE、BE、CN的配置说明。
环境检查的相关的命令,以及如何获取部署文件。

存算一体模式部署

三种安装模式。一是手动自己安装,二是基于starRocks的管理工具,三是基于k8s的管理工具。

存算分离模式部署

基于不同存储介质的部署,包含S3、GCS、Blob、MinIO、HDFS等。

后期管理

部署后的设置信息。
如何升级和回滚版本。文章来源地址https://www.toymoban.com/news/detail-823108.html

到了这里,关于【技术预研】StarRocks官方文档浅析(1)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 大数据StarRocks(七):数据表创建

    1.1 Row Column 一张表包括行(Row)和列(Column)。Row 即用户的一行数据。Column 用于描述一行数据中不同的字段。 ⚫ 在默认的数据模型中,Column 只分为排序列和非排序列。存储引擎会按照排序列对数据进行排序存储,并建立稀疏索引,以便在排序数据上进行快速查找。 ⚫ 而在

    2024年01月16日
    浏览(39)
  • 数据仓库系列:StarRocks 入门培训教程

    其它文章请参考 数据仓库系列:StarRocks 下一代高性能分析数据仓库的架构、数据存储及表设计 数据仓库系列:StarRocks的简单试用及与clickhouse的对比 数据仓库系列:如何将StarRocks集群与Jupyter集成? StarRocks 是一款MPP DB, 对标ClickHouse、Vertica、Teradata、Greenplum,在查询性能上远

    2024年02月11日
    浏览(42)
  • StarRocks 中的数据模型和索引使用

    StarRocks 支持四种数据模型,分别是明细模型 ( Duplicate Key Model )、聚合模型 ( Aggregate Key Model )、更新模型 ( Unique Key Model ) 和主键模型 ( Primary Key Model )。 1.1 明细模型 明细模型是默认的建表模型。如果在建表时未指定任何模型,默认创建的是明细类型的表。排序列使用稀疏索引

    2024年02月07日
    浏览(26)
  • 【StarRocks】数据结构和修改表语句大全

    1 数据类型 2 修改表结构 StarRocks 支持多种 DDL 操作。 可以通过 ALTER TABLE 命令可以修改表的 Schema,包括增加列,删除列,修改列类型(暂不支持修改列名称),改变列顺序。 1 增加列 例如,在以上创建的表中,在 ispass 列后新增一列 uv,类型为 BIGINT,默认值为 0。 2 删除列

    2024年02月15日
    浏览(41)
  • Flink+StarRocks 实时数据分析新范式

    摘要:本文整理自 StarRocks 社区技术布道师谢寅,在 Flink Forward Asia 2022 实时湖仓的分享。本篇内容主要分为五个部分: 极速数据分析 实时数据更新 StarRocks Connector For Apache Flink 客户实践案例 未来规划 点击查看原文视频 演讲PPT 统一 OLAP 分析的趋势,以及 StarRocks 极速查询分析

    2024年02月13日
    浏览(38)
  • 【大数据OLAP引擎】StarRocks为什么快?

    StarRocks最初主要的优势是性能,当时在单表查询方面与性能标杆ClickHouse不相上下,而join优化特性使其在多表关联查询场景下的性能表现要远远优于ClickHouse,替换ClickHouse自然也就成了StarRocks的第一个目标。 而StarRocks的野心不止于此,后来又进一步发展了联邦查询功能,成为

    2024年02月01日
    浏览(28)
  • Paimon+StarRocks 湖仓一体数据分析方案

    摘要:本文整理自阿里云高级开发工程师曾庆栋(曦乐)在 Streaming Lakehouse Meetup 的分享。内容主要分为四个部分: 传统数据仓库分析实现方案简介 Paimon+StarRocks 构建湖仓一体数据分析实现方案 StarRocks 与 Paimon 结合的使用方式与实现原理 StarRocks 社区湖仓分析未来规划 点击查

    2024年02月10日
    浏览(32)
  • starrocks对大量数据怎么实现hash join

    以下是个人理解,可能不正确,希望评论指正: be的入口是:main-start_be,这里注册的doris::PBackendService中有一个exec_plan_fragment用来执行fe发来的查询计划。执行分两步:FragmentExecutor::prepare,FragmentExecutor::execute。 在prepare阶段,FragmentExecutor::prepare-_prepare_pipeline_driver-PipelineBuild

    2024年02月21日
    浏览(22)
  • 第3.2章:StarRocks数据导入--Stream Load

    Stream Load可以说是StarRocks最为核心的导入方式,StarRocks的主要导入方式例如Routine Load、Flink Connector、DataX StarRocksWriter等,底层实现都是基于Stream Load的思想,所以我们着重介绍。 Stream Load是由用户发送HTTP请求将本地文件或数据流导入至StarRocks中的导入方式,其本身不依赖其他

    2024年02月08日
    浏览(29)
  • 使用flink sqlserver cdc 同步数据到StarRocks

    前沿: flink cdc功能越发强大,支持的数据源也越多,本篇介绍使用flink cdc实现: sqlserver-》(using flink cdc)-〉flink -》(using flink starrocks connector)-〉starrocks整个流程 1.sqlserver 环境准备(得使用sqlserver 16以下版本,flink cdc当前只支持16以下sqlserver版本) 我这个使用的是docker环

    2024年02月10日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包