超级独角兽 Databricks 的崛起之路

这篇具有很好参考价值的文章主要介绍了超级独角兽 Databricks 的崛起之路。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

超级独角兽 Databricks 的崛起之路

在数据扩张以及 AI 兴起的时代,数据存储和分析平台拥有巨大价值和能量。 

随着互联网数据的爆炸性增长,数据已经成为企业的新型资源,犹如石油般重要。越来越多的企业希望利用各种结构化和非结构化数据来发挥自己的优势。

然而,他们面临着复杂的遗留基础设施、数据孤岛的解决以及高延迟的管理等挑战。因此,数据湖的需求逐渐增长。数据湖是一种存储库,能够以本机格式摄取大量原始数据,使企业能够在需要时轻松地访问它们。

Databricks 是目前一级市场中的超级独角兽公司。其帮助企业准备用于分析的数据,支持采用机器学习和数据驱动的决策。它还使数据科学能够与数据工程和其他业务部门协作来构建数据产品。今天,它已经扩展成为一个更广泛的湖仓一体的 Databricks Marketplace。

01 旅程始于 Apache Spark

Databricks 团队由七位计算机科学博士组成,他们一直致力于开发用于数据处理的 Spark 引擎。该项目在 2014 年创造了数据排序速度的世界纪录。

为了让更多用户使用 Spark,他们选择将其开源,并在 2013 年创立了 Databricks 公司。同年,该公司完成了 A 轮融资,由 A16z 领投。2016 年 1 月,Databricks 更换了新的 CEO。一年后,该公司完成了第一笔百万美元的交易。

总体而言,Databricks 团队是 Apache Spark 的核心开发者,具有绝对的影响力和理解力,因此作为 Spark 的商业化公司,Databricks 名正言顺。

02 拓展产品线助力收入多元化

Databricks 最初专注于 Spark,用于查询存储在数据湖中的大型非结构化数据集。此后,为迎合市场,Databricks 升级为湖仓一体平台,其基于 Spark 构建,提供为数据湖提供 ACID 事务和数据版本控制的 Delta Lake;用于管理机器学习工作流程的开源平台 MLflow;以及基于 SQL 的数据分析协作工具 Redash。

总体来看,Databricks 湖仓一体平台结合了数据湖和数据仓库的元素。它具有数据湖的灵活性、成本效益和规模,同时还提供数据仓库的数据管理和 ACID 事务。用户可以在所有数据上启用商业智能和机器学习。

Databricks 产品在 AWS、Azure、GCP 等主要云服务上提供,其平台为数据、分析和机器学习工作提供了一个统一的环境。可视化可以成为这些不同活动的组成部分。

超级独角兽 Databricks 的崛起之路

来源:Databricks

03 数据湖市场增长,用户横跨大中小

Databricks 相信企业正在摆脱孤立的系统来存储数据,而是选择集中式的数据存储。这种方法帮助企业通过商业智能和预测分析深入了解过去和未来的趋势。

数据湖技术正是基于此,其允许将所有数据类型和来源存储在一起。数据表明,数据湖市场将由 2019 年的 79 亿$增长到 2024 年的 201 亿$。

超级独角兽 Databricks 的崛起之路

来源:marketsandmarkets

此外,Databricks 的客户横跨大中小企业,以及各个行业。截至 2023 年 03 月,其全球已有超过 9000 家企业用户。包括 AT&T、壳牌、巴宝莉、丰田、Adobe、康泰纳仕和再生元制药等。

如果我们用 Databricks 2022 年 Q2 末的 ARR 10亿$除以它 2022 年 Q2 末 7000+的客户数量,我们可以粗略估算 Databricks 的 ACV(平均合同价值)约为 14.3 万美元,相比 Snowflake 的 30.1 万$ (2023.Q3 估算),仍有提升空间。

04 三类对手的夹击

2012 年,前 Oracle 架构师创立的 Snowflake 是 Databricks 不可忽视的对手。最初,Snowflake 将自己定位为提供数仓和分析计算工作负载的云数据平台,主要面向业务分析师和数据工程师等用户。同期,Databricks 则一直受数据科学家和机器学习工程师的青睐。

但现在二者的界限在模糊,比如 Snowflak 发布了 Snowpark for Data Science、事务数据库以及 Python 支持功能,希望以此吸引数据科学家。而 Databricks 则推出了 Databricks SQL、Delta Lake 功能和 Unity 目录等产品,以满足数据存储和注重安全的客户。

从模式来看,Snowflake 是闭源生态,而 Databricks 是开源的。Databricks 的主要产品线都可以免费使用,当客户需要获得更高级的功能和支持时,可以选择 Databricks 的企业产品。Snowflake 提供现成的解决方案,使公司能够快速开展基本分析,而 Databricks 提供更好的定制和配置,让客户能够完全控制他们的设置。

2022 年底,Snowflake 的年收入 21 亿$,而 Databricks 预计年收入 14亿$。预计两家的竞争会愈发激烈。

第二类竞争对手是云厂商。Databricks 与云厂商的专有产品存在竞争。比如在大数据处理方面,AWS 有 Amazon EMR,Azure 有 Azure HDInsight,GCP 有 Dataproc。在业务分析解决方案层面, Amazon QuickSight、Azure的 Power BI Embedded 以及 GCP 的Looker 等,都与 Databricks 存在竞争。

最后,Databricks 与特定的数据管理和科学领域解决方案公司也存在竞争。比如 Databricks 的调度程序类似 Apache Airflow,MLflow 产品与 DataRobot 和 Alteryx 竞争。

05 收入持续增长,资本认可的超级独角兽

Databricks 本身是开源软件,其会通过提供附加功能收费。Databricks 会为企业提供其开源软件的完全托管版本,以及其他辅助工具,如用于编写查询的 SaaS 工具和用于连接数据源的连接器等。

付费模式方面,Databricks 根据客户每秒消耗的计算资源量收费。为此,其使用了一种自己独创的 DBU 作为其标准化单位,工作负载消耗的 DBU 数量取决于多个指标,包括使用的计算资源、处理的数据量、区域、所处的分级定价层以及正在使用的服务类型等。

此外,为了吸引用户,与其他开源公司类似,Databricks 也为用户提供了 14 天免费试用期。

超级独角兽 Databricks 的崛起之路

来源:Databricks

财务方面,Databricks 也实现了跨越式的增长。2019.Q3 结束时其 ARR 为 2 亿$,2020 全年收入 4.25 亿$,2021 年 ARR 超 8 亿$。截至 2022 年 08 月,Databricks 的 ARR 已经超 10 亿$,并且年增长超过 70%。

截至 2021 年 08 月 Databricks 的估值 380 亿$,总共在资本市场筹集了 35 亿$,其投资者也星光璀璨,包括 A16z、Tiger Global、Amazon Web Services、Microsoft、Coatue 等。

当然也有消息透露,2022 年 10 月 Databricks 降低了内部股价,使其估值下调至 310 亿$,比 2021 年同期下降约 7%。但无论如何,Databricks 仍然是一级市场中的超级独角兽。

06 趋势、机遇与风险

随着云存储成本下降和网速提升,企业越来越多地选择将所有数据存储在中央存储库,而不是将不同的数据类型单独存储。这种集中化趋势帮助公司通过实时商业智能和预测分析更好地了解业务运营。同时,数据爆炸式增长也使公司维护多个大型数据存储变得不切实际,从而导致数据湖和数据仓库融合到一个平台中。

ChatGPT 一直是各行业的热点。Databricks 也迎接了这一浪潮,其湖仓一体平台允许数据团队存储和保护数据、生成分析和见解,并推动机器学习工具的开发。此外,Databricks 还提供与 TensorFlow、PyTorch 等流行人工智能框架的集成,使构建和部署机器学习模型变得容易。

Databricks 依靠 AWS、Azure 和 GCP 这类云基础设施供应商来提供服务。回望过去,与微软的合作是 Databricks 的里程碑,这帮助其收入从 2017 年初的不到 100 万$增长到 2018 年的超过 1 亿$。如果与主要云厂商关系发生变化,将影响 Databricks 的服务能力。

综上所述,我们有理由相信虽然面临挑战,但在这个数据扩张以及 AI 兴起的时代,Databricks 为企业提供的单一的数据存储和分析平台是有价值的,其很有机会和能力抓住这一浪潮。

作者简介

郑博,Aka Harbour 哈博。崔牛会非著名牛油,人到中年的 2B 基础架构创业老炮,CnosDB 云原生时序数据库开源社区发起人。

CnosDB简介

CnosDB是一款高性能、高易用性的开源分布式时序数据库,现已正式发布及全部开源。

欢迎关注我们的社区网站:https://www.cnosdb.com文章来源地址https://www.toymoban.com/news/detail-466890.html

到了这里,关于超级独角兽 Databricks 的崛起之路的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Cloudflare — 从美国农村到硅谷独角兽,云计算新贵的成长秘籍

    DNS 服务:奠定可靠访问的基石 Cloudflare 通过快速、稳定的域名解析服务,确保了网站的访问速度和可靠性。同时,强大的 DDoS 防护措施保障了服务的高可用性和持续性。 🚨 注意:SSL/TLS 设置为 Flexible 并不安全,在 Cloudflare 到源站之间仍存在中间人攻击的风险。如果你的服务器开启

    2024年04月16日
    浏览(51)
  • 直播助力杭州电商独角兽冲击上市,分账系统重构电商交易新格局

    从2016年传统电商开始探索“直播+电商”新模式,到短视频平台的弯道超车,五年内直播电商实现了从零到2万亿GMV的突破。从占比上看,2021年,全国网上零售额达13.1万亿元,直播电商占电商零售总额接近20%;从增速上看,中国的电商零售行业在经历了2014年到2017年的高速增长

    2024年02月12日
    浏览(35)
  • 资本认可 | 开源网安成为中国未来独角兽企业,引领软件安全不断发展

    4月11日,第七届万物生长大会·中国未来独角兽大会盛大召开,本次大会中国投资发展促进会创投专委会联合微链共同发布了 《2023中国未来独角兽TOP100榜单》,开源网安成功入选榜单。 《2023中国未来独角兽TOP100榜单》瞄准近 两年融资较为活跃或融资金额较大、成立不足10年

    2024年02月01日
    浏览(57)
  • 新火种AI|估值180亿!月之暗面成为AI领域又一独角兽...

    作者:小岩 编辑:彩云 2月20日,AI领域内的初创企业月之暗面完成了全新一轮的融资,金额超过10亿美元,一举刷新国内AI领域最大单笔融资记录。据悉,为月之暗面进行投资的资本方众多,包括红杉中国,小红书,美团,阿里等众多资本。 有了这笔巨额融资的加持,月之暗

    2024年04月13日
    浏览(26)
  • AIGC独角兽官宣联手,支持千亿大模型的云实例发布,“云计算春晚”比世界杯还热闹...

    梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 现在AI最火的方向是什么?那必须是 AIGC (AI Generated Content,利用人工智能技术来生成内容)。 AIGC最火的公司是谁?莫过于开源AI作画模型Stable Diffusion背后的 StabilityAI 。 对于这家新晋独角兽,最近两条动向值得关注: 产品上, Stable

    2024年02月13日
    浏览(32)
  • 工业级成熟航运港口人工智能产品全球前三船公司及港口码头落地,中国上海人工智能独角兽中集飞瞳全球应用最广规模最大最先进港航AI企业

    中国上海人工智能独角兽CIMCAI中集飞瞳,是全球应用落地最广,规模最大的港口航运人工智能高科技企业。中国人工智能独角兽CIMCAI中集飞瞳 巅峰产品行业第一,产品在全球港区及集装箱枢纽规模投产包括:全球港口码头智能闸口;全球港口岸边卸/装船;全球航运船公司;

    2024年02月05日
    浏览(33)
  • AIGC时代:超级个体的崛起,抓住这个风口

    文 / 高扬(微信公众号:量子论) 今天的一则消息不知大家有没关注,中央会议精神特别提到“要重视通用人工智能发展,营造创新生态,重视防范风险。” 这表示国家层面已在重视通用人工智能的发展,也意味ChatGPT引爆的这场人工智能热潮还会持续下去。 我感觉今年的这

    2024年02月11日
    浏览(44)
  • Chatgpt的崛起之路

    OpenAI 11月30号发布,首先在北美、欧洲等已经引发了热烈的讨论。随后在国内开始火起来。全球用户争相晒出自己极具创意的与ChatGPT交流的成果。ChatGPT在大量网友的疯狂测试中表现出各种惊人的能力,如流畅对答、写代码、写剧本、纠错等,甚至让记者编辑、程序员等从业者

    2024年01月25日
    浏览(30)
  • 超越人类的极限:人工智能的崛起之路

    🎉欢迎来到AIGC人工智能专栏~超越人类的极限:人工智能的崛起之路 ☆* o(≧▽≦)o *☆嗨~我是IT·陈寒🍹 ✨博客主页:IT·陈寒的博客 🎈该系列文章专栏:AIGC人工智能 📜其他专栏:Java学习路线 Java面试技巧 Java实战项目 AIGC人工智能 数据结构学习 🍹文章作者技术和水平有

    2024年01月19日
    浏览(44)
  • 数据分析进阶,Databricks集成GitHub Copilot实用指南

    在Databricks中集成AI驱动的数据分析代码编写工具GitHub Copilot,可以优化和简化开发过程。 微信搜索关注《Python学研大本营》,加入读者群,分享更多精彩 GitHub Copilot是由GitHub与OpenAI合作开发的人工智能驱动的代码补全助手,它采用了ChatGPT模型,旨在帮助开发人员加速编码过程

    2024年02月02日
    浏览(22)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包