腾讯大数据 x StarRocks|构建新一代实时湖仓

这篇具有很好参考价值的文章主要介绍了腾讯大数据 x StarRocks|构建新一代实时湖仓。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

2023 年 9 月 26 日,腾讯大数据团队与 StarRocks 社区携手举办了一场名为“构建新一代实时湖仓”的盛大活动。活动聚集了来自腾讯大数据、腾讯视频、腾讯游戏、同程旅行以及 StarRocks 社区的技术专家,共同深入探讨了湖仓一体技术以及其应用实践等多个备受瞩目的话题,观看人数两万+。

大数据未来发展趋势和方向是许多开发者都关心的议题。活动一开场,腾讯大数据产研负责人陈鹏以及镜舟科技 CTO 张友东以业界专家的视角进行了一场精彩的技术对谈。他们就当前大数据技术热点、湖仓技术发展以及未来湖仓一体技术的发展趋势表达了未来大数据将朝着“one data, all analytics”的方向发展。

腾讯作为国内领先的互联网企业,在湖仓一体方面有丰富的实践经验。通过尝试与摸索,腾讯大数据基于 StarRocks拓展和升级湖仓一体化的架构,为业务提供高性能、一站式的解决方案。在活动中,腾讯的大数据团队分享了他们在湖仓一体方面的先进经验,包括如何搭建湖仓融合架构,湖仓分析在腾讯视频业务场景中的应用以及腾讯游戏如何从Lambda 架构逐步演进至湖仓一体架构的技术进程。其中存算分离和数据冷热分层方面的最佳实践也给其他开发带来了极具价值的借鉴意义。

与此同时,同程旅行的周涛老师应邀介绍了同程旅行是如何通过引入 StarRocks 成功解决用户画像中的问题,提升查询效率并高效实现复杂查询。 本文将汇总此次技术交流活动的重要内容和视频资料,同时由衷感谢社区中的每一位小伙伴对此次活动的支持和积极参与。未来,我们将持续与大家分享更多高质量的技术内容!

技术对谈:开源开放与下一代湖仓

陈鹏 腾讯大数据产研负责人/腾讯大数据技术委员会执行委员

张友东 镜舟科技 CTO/StarRocks 技术指导委员会成员

在本次分享中,两位专家深入探讨了当前大数据技术的焦点议题,湖仓技术的发展历程,以及 StarRocks 和腾讯在湖仓一体化方面的演进历程。他们还谈到了未来湖仓一体技术的趋势。

陈鹏认为大数据技术的发展应该是一个逐步精炼的过程,大数据体系需要变得更加精细化,以使业务应用变得更容易。这需要在数据链路和大数据架构的共同作用下实现,而不仅仅依赖一两个技术点。因此,腾讯大数据正在朝着一体化的方向发展,这一体系包括4个横向和3个纵向的维度。4个横向是指软硬一体、资源一体、存储缓存一体和计算一体,这有助于构建更简单和优雅的数据架构。3个纵向是指通过实时湖仓、虚拟引擎和智能平台来实现大数据的全面自适应和自动化。

张友东认为目前数据量经历了爆发式增长,而大数据体系主要解决的问题是如何从海量数据中挖掘有价值的信息。在这一背景下,StarRocks 在朝着湖仓一体化方向演进的过程中,实现了一份数据支持所有分析场景,从而极大简化了数据分析的流程。这也与腾讯大数据的演进路线相一致。

总的来说,未来湖仓的发展趋势将趋向于数据库化,简化流程,实现一体化,从而推动智能化应用的发展。

技术对谈:开源开放与下一代湖仓

腾讯天穹一站式湖仓融合平台架构揭秘

陈九天 腾讯大数据高级工程师/StarRocks Active Contributor

本次分享九天首先探讨了目前业内在湖仓融合场景下遇到的问题:湖仓数据如何自由流转、湖仓数据如何做到融合查询、如何优化湖仓建模链路等,同时介绍了天穹 StarRocks 湖仓融合架构是如何解决以上问题,并大规模落地腾讯内部业务的。该架构在兼顾查询性能与存储成本的情况下,大大简化了用户的湖仓建模链路。

腾讯天穹一站式湖仓融合平台架构揭秘

同程旅行如何基于 StarRocks 实现用户画像分析

周涛 同程旅行数据中台负责人

2022年,同程旅行引入了 StarRocks,用于统一 OLAP 组件,并在公司内部广泛应用。目前,已成功应用于住宿、出行以及其他领域,包括BI看板、数据分析、指标系统、风险控制、反爬、用户营销和实时数据仓库等各业务领域。

本次分享重点介绍了 StarRocks 在同程旅行中的用户画像和 CDP(Customer Data Platform)应用实践。引入StarRocks 前,用户画像分析存在问题,如标签导入资源消耗大、导入操作影响查询性能、仅支持宽表查询,无法处理复杂关联和聚合查询。引入 StarRocks后,同程旅行优化了数据导入功能,显著提高了复杂查询速度,实现了明细表和位图表的高效关联,更好支持 CDP 人群分析和导出营销等关键功能。

同程旅行如何基于 StarRocks 实现用户画像分析

StarRocks 在腾讯视频的应用实践

赵轩 腾讯视频 数据工程中心 大数据开发高级工程师

本次主要向大家介绍了腾讯视频使用StarRocks在湖仓分析场景的上的应用实践,以及腾讯视频数据架构的演进历程。通过描述湖仓分析场景遇到的查询效率、湖仓分层模型构建等方面问题,分享了StarRocks基于Iceberg进行湖上分析的解决方案。此外,还介绍了StarRocks湖仓架构下分层模型建设方式以及数据冷热分离的存储方式;同时在应用实践上介绍了使用StarRocks构建指标服务,通过 Bitmap、聚合引擎、逻辑视图、指标加速等方式助力个性化数据分析,构建高效、易用、简单的湖仓架构以提升数据价值。

StarRocks 在腾讯视频的应用实践

腾讯游戏基于 StarRocks 的湖仓一体探索

黄奕文 腾讯游戏数据分析引擎研发工程师/StarRocks Active Contributor

本次分享奕文主要介绍了腾讯游戏从原有Lambda架构,基于StarRocks的数仓架构,基于StarRocks的湖仓一体架构的演进技术路线。围绕存算分离,数据冷热分层,湖仓一体体验优化等方面进行了重点建设;同时在落地实践阶段,针对异步物化视图,查询性能优化,离线导入性能进行了深入的打磨,从而实现兼顾性能和成本的易用湖仓一体化架构。

腾讯游戏基于 StarRocks 的湖仓一体探索

本文由 mdnice 多平台发布文章来源地址https://www.toymoban.com/news/detail-722978.html

到了这里,关于腾讯大数据 x StarRocks|构建新一代实时湖仓的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Sora:新一代实时音视频通信框架

             Sora 是一个开源的实时音视频通信框架,旨在提供高效、稳定、可扩展的音视频通信解决方案。 它基于 WebRTC技术 ,支持跨平台、跨浏览器的实时音视频通信,并且具备低延迟、高并发、易集成等特点。         --点击进入Sora(一定要科学哦,不会的私信)  目录

    2024年02月22日
    浏览(58)
  • 实时数仓Hologres 新一代弹性计算组实例技术揭秘

    随着实时数仓在业务生产系统的普及,资源弹性、资源隔离等保障业务稳定性方面的技术需求开始变得越来越迫切。Hologres在保障业务方面持续优化核心技术竞争力,过去一年中,Hologres创新提出并实现了新一代弹性计算组实例,旨在通过更强的隔离和弹性能力,进一步提高业

    2024年02月03日
    浏览(48)
  • 实时数仓Hologres新一代弹性计算组实例技术揭秘

    作者:王奇(花名慧青) 阿里云Hologres研发 随着实时数仓在业务生产系统的普及,资源弹性、资源隔离等保障业务稳定性方面的技术需求开始变得越来越迫切。Hologres在保障业务方面持续优化核心技术竞争力,过去一年中,Hologres创新提出并实现了新一代弹性计算组实例,旨

    2024年02月07日
    浏览(54)
  • 新一代构建工具 maven-mvnd

    maven 作为一代经典的构建工具,流行了很多年,知道现在依然是大部分Java项目的构建工具的首选;但随着项目复杂度提高,代码量及依赖库的增多使得maven在大型项目的构建的速度上被人诟病。 因此推出了gradle之类的项目,虽然gradle在构建效率是高于maven,但是在一般的小项

    2024年02月14日
    浏览(47)
  • 如何基于 Apache Doris 构建新一代日志分析平台

    作者:肖康,SelectDB 技术 副总裁 、Apache Doris Committer 日志数据是企业大数据体系中重要的组成部分之一,这些数据记录了网络设备、操作系统以及应用程序的详细历史行为,蕴含了丰富的信息价值,在可观测性、网络安全、业务分析等关键业务领域发挥着重要作用,可帮助企

    2024年02月15日
    浏览(60)
  • 百度安全七大开源项目构建新一代人工智能安全技术栈

    新技术、新业态催生了传统网络安全格局的深刻变革。伴随移动互联网,大数据、云计算、人工智能等新一代信息技术的快速发展,围绕网络和数据的服务与应用呈现爆发式增长,智能设备将无所不在,智能家居、无人车、物联网将渗透到人类社会的各个角落,丰富的应用场

    2024年02月22日
    浏览(66)
  • 中国在构建新一代人工智能开放平台方面的策略与目标

    作者:禅与计算机程序设计艺术 随着人工智能技术的不断提升和应用,传统的人工智能解决方案正在被颠覆。越来越多的公司和机构都在探索着如何利用人工智能技术实现更高效、更可靠、更智能的业务模型。近年来,中国政府已经率先开启了构建新一代人工智能开放平台的

    2024年02月07日
    浏览(55)
  • 构建新一代的K8s原生Java微服务+Quarkus实战

    送书第一期 《用户画像:平台构建与业务实践》 送书活动之抽奖工具的打造 《获取博客评论用户抽取幸运中奖者》 送书第二期 《Spring Cloud Alibaba核心技术与实战案例》 送书第三期 《深入浅出Java虚拟机》 送书第四期 《AI时代项目经理成长之道》 送书第五期 《Kubernetes原生

    2024年02月08日
    浏览(46)
  • Flink CDC 新一代数据集成框架

    前言: 主要讲解了技术原理,入门与生产实践,主要功能:全增量一体化数据集成、实时数据入库入仓、最详细的教程。Flink CDC 是Apache Flink的一个重要组件,主要使用了CDC技术从各种数据库中获取变更流并接入到Flink中,Apache Flink作为一款非常优秀的流处理引擎,其SQL API又

    2024年02月13日
    浏览(61)
  • 什么是ETLT?他是新一代数据集成平台?

    在现代数据处理和分析的时代,数据集成是一个至关重要的环节。数据集成涉及将来自各种来源的数据合并、清洗、转换,并将其加载到数据仓库或分析平台以供进一步的处理和分析。传统上,数据集成有两种主要方法,即ETL(提取、转换、加载)和ELT(提取、加载、转换)

    2024年02月09日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包