新一代大数据管家 DataSophon 1.2 重磅发版

这篇具有很好参考价值的文章主要介绍了新一代大数据管家 DataSophon 1.2 重磅发版。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

新一代大数据管家 DataSophon 1.2 重磅发版,大数据

在大数据领域,现在普遍认为是后 Hadoop 时代,CDH 的停更和闭源导致传统的 Hadoop 体系组件栈没有一个称手好用的管理工具,越来越多新一代的大数据项目也在层出不穷, 同样也需要管理,并且需要适配云原生的能力。不管技术如何演进都面临组件栈管理和运维的难题,鉴于此 DataSophon 作为 Datavane 开源组织的推荐项目重磅开源。
 

新一代大数据管家DataSophon



DataSophon 是一个国产开源的大数据管理平台,在兼顾传统 Hadoop 组件的同时又支持新一代大数据组件栈,并且支持云原生的能力,致力于快速实现大数据组件部署、监控以及自动化运维管理,旨在帮助用户快速构建稳定、高效、自愈、可弹性伸缩的大数据云原生平台。项目自开源以来,得到了很大关注,社区发展迅速,近日 DataSophon 社区正式发布了 1.2.0 版本,带来了诸多改进和新功能的更新,具备更高的可用性和稳定性,欢迎大家下载使用。
 

新特性解读


1.2.0 版本,作为 DataSophon 开源之后发布的第一个版本,因此团队非常重视。在该版本全面支持了 Apache Doris,通过 DataSophon 可以便捷的部署、管理、监控 Doris。除此以外本次新增了初始化模块,可以自动完成集群环境初始化工作,避免因环境不一致导致集群安装失败的问题,还优化服务指令执行流程等,具体更新如下:
 

1. 全面支持 Doris


Apache Doris 是基于 MPP 架构的新一代开源实时数据仓库,以极速易用的特点被人们所熟知, 在实时数仓和数据分析领域越发流行,本次 DataSophon 对 Doris 做了全面的支持,现在可在 DataSophon 上轻松的完成 Apache Doris 的集群部署和运维管理。

DataSophon 全面支持Apache Doris

集群部署

在 Doris 集群部署方面,本次的新版本能够自动将 Apche Doris 的 Follower、Observer、Be 等多种角色添加到集群中,全程界面化操作,动动鼠标即可完成,部署进度一目了然,大大省去了手动添加角色的麻烦,轻松实现集群的快速扩展和管理。

集群监控

对于 Apache Doris 集群的各项监控指标,也重点做了支持。您可以的在 DataSophon 中获得 Doris 集群的实时指标的各项信息,包括集群的节点数、详情、连接信息、运行状态和 CPU、JVM、内存、磁盘大小和 IO 的使用情况... 此外,您还可以查看集群的任务运行情况和其他详细信息,以便更好地了解集群的运行状况。

新一代大数据管家 DataSophon 1.2 重磅发版,大数据

集群运维

在集群运维方面 DataSophon 支持对 Doris 整个集群、FE、BE 节点进行启动、停止、重启等常规操作,同时支持了对 Doris FE、BE 节点进行在线扩/缩容。可以很轻松的设置 Doris 的监控指标和告警,Apache Doris 各项参数也可以很方便的进行单个或批量设置,同时提供进入Doris 的原生WebUI 的入口,DataSophon 中 提供的各种丰富的运维操作可以极大的方便用户去运维管理 Doris 。

新一代大数据管家 DataSophon 1.2 重磅发版,大数据


 

2. 新增多个监控指标  

本次新增了多个生产环境中普遍关心的运维指标,旨在满足大数据集群生产环境中的关键需求。这些运维指标的引入,使得用户能够更加有效地管理大数据集群,提高集群性能,降低故障率,从而实现高效运维。主要新增指标如下:

  • HDFS 整个集群的客户端连接数。

  • NameNode 丢失的块数。

  • DataNode RPC 被调用次数。

  • DataNode RPC  队列积压长度。

  • DataNode RPC 平均处理时间。

  • ResouceManager RPC 队列平均处理时间。

  • ResouceManager RPC 队列积压长度。

  • NodeManager Container 启动个数。

  • NodeManager Container 正在运行个数。

  • NodeManager Container 初始化中个数。

  • NodeManager 磁盘损坏个数。

...

新一代大数据管家 DataSophon 1.2 重磅发版,大数据

新一代大数据管家 DataSophon 1.2 重磅发版,大数据

3. 新增初始化模块

在集群部署过程中,都需要进行集群环境初始化,例如配置主机名、配置免密登录、安装离线 yum 源等初始化环境操作。DataSophon 通过 datasophon-init 模块自动初始化安装和配置所需的依赖项,省去手动安装和配置的繁琐步骤,从而大大提高部署效率,减少因集群环境不一致导致集群安装失败的风险。

同时为了方便运维人员操作和使用,系统不仅提供了友好的用户界面还提供了二次开发接口。通过自定义扩展二次开发,可以实现与不同类型的操作系统的兼容,满足不同用户的需求。这样一来,用户可以根据自己的实际情况进行灵活的配置和部署,提高了工作效率和准确性。
 

4. 其他改进和更新  

1、升级 SpringBoot 版本为 2.6.1。

2、新增项目启动时自动创建数据表和初始化数据功能。

3、优化服务指令执行流程,避免出现服务指令进度卡死的情况。

4、优化 Hive 默认使用 Hive on YARN 环境配置。

5、新增集群删除功能。

6、修复不选择安装的服务实例时依然生成服务指令的问题。

7、修复租户管理中租户列表分页不生效的问题。

8、修复服务角色实例警告报警状态无法恢复的问题。

9、修复租户管理租户列表和用户组列表未按集群隔离的问题。

10、修复 Doris 安装部署时,未自动生成 Doris BE 数据目录的问题。

11、修复 HDFS 安装部署时出现找不到 keystore 文件的问题。

12、 修复项目启动时出现的 "because it exists, maybe from xml file" 错误。

 

新官网上线


本次 DataSophon 上线了新官网,也完善了相关使用文档。在此感谢 Apache StreamPark 社区提供的技术支持,感谢  @songjianet、@haitaodesign 对官网的贡献。

新一代大数据管家 DataSophon 1.2 重磅发版,大数据

感谢贡献者


DataSophon 开源社区的发展,离不开广大用户群体的积极反馈和宣传布道,更离不开贡献者们的无私贡献,感谢对此版本做出贡献的每一位贡献者。

致谢名单(排名不分先后):

88fantasy、a19920714liou、haitaodesign、WujieRen、thomasg19930417、AllDataDC、zhaoxiaoyi、liu-hai、gtk96、lnnlab、javaht、hzluting、zhzhenqin、liugddx、zq0757、chenss-1、zhu-mingye、zhangdw123、liuxin319、whybeyoung、hitozhu、green241、chyueyi、zhegemingzimeibanquan、songjianet

加入我们


DataSophon 项目自开源以来,得到了很大关注,社区发展迅速, 越来越多的用户开始在生产环境部署使用 DataSophon,开发者也逐渐变多。如果 DataSophon 项目对您有帮助,请在 Gitee 或 Github 搜索 DataSophon 支持一下,点击 star 加关注。

我们明白项目只有真正解决问题, 给用户带来实际的价值才是立命之本,目前我们正在努力构建发展社区,我们坚信道阻且长,行则将至,竭诚欢迎广大的开发者和我们一起建设 DataSophon 项目,共同推动项目的发展。

💻 项目地址:

https://github.com/datavane/datasophon

https://gitee.com/datavane/datasophon

🧐 提交问题和建议:https://github.com/datavane/datasophon/issues

🥁 贡献代码:https://github.com/datavane/datasophon/pulls

💁‍♀️ 官方文档https://datasophon.github.io/datasophon-website文章来源地址https://www.toymoban.com/news/detail-726912.html

到了这里,关于新一代大数据管家 DataSophon 1.2 重磅发版的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 基于EMR的新一代数据湖存储加速技术详解

    摘要:本文整理自阿里云开源大数据平台数据湖存储团队孙大鹏在7月17日阿里云数据湖技术专场交流会的分享。本篇内容主要分为两个部分: 背景介绍 JindoData 数据湖存储解决方案 点击查看直播回放 大数据行业蓬勃发展,主要源自于通讯技术的发展,全球数据规模,预计2

    2024年02月02日
    浏览(56)
  • 新一代数据湖存储技术Apache Paimon入门Demo

    目录 前言 1. 什么是 Apache Paimon 一、本地环境快速上手 1、本地Flink伪集群 2、IDEA中跑Paimon Demo 2.1 代码 2.2 IDEA中成功运行 3、IDEA中Stream读写 3.1 流写 3.2 流读(toChangeLogStream) 二、进阶:本地(IDEA)多流拼接测试 要解决的问题: note: 1、\\\'changelog-producer\\\' = \\\'full-compaction\\\' (1)m

    2024年02月08日
    浏览(48)
  • 腾讯大数据 x StarRocks|构建新一代实时湖仓

    2023 年 9 月 26 日,腾讯大数据团队与 StarRocks 社区携手举办了一场名为“构建新一代实时湖仓”的盛大活动。活动聚集了来自腾讯大数据、腾讯视频、腾讯游戏、同程旅行以及 StarRocks 社区的技术专家,共同深入探讨了湖仓一体技术以及其应用实践等多个备受瞩目的话题,观看

    2024年02月07日
    浏览(46)
  • 新一代分布式融合存储,数据场景All In One

            2023年5月11日,浪潮信息全国巡展广州站正式启航。会上,重磅发布新一代分布式融合存储AS13000G7,其采用极致融合架构设计理念,实现同一套存储满足四种非结构化数据的“All In One”高效融合,数据存力提升300%,IO性能提升100%;同时,实现四种非结构化协议无损

    2024年02月13日
    浏览(33)
  • 数据湖仓一体化架构:探究新一代数据处理的可能性

    随着大数据的快速发展,企业不断寻求高效、灵活和经济的方法来处理和管理海量数据。在这种背景下,数据湖和数据仓库这两种不同的架构模式各自展现出其独特的优势。而数据湖仓一体化架构,是对这两种模式优势的综合,为企业提供了一个全新的数据管理方案。  2.1

    2024年02月08日
    浏览(37)
  • Flink CDC 3.0 正式发布,详细解读新一代实时数据集成框架

    Flink CDC 是基于数据库日志 CDC(Change Data Capture)技术的实时数据集成框架,支持了全增量一体化、无锁读取、并行读取、表结构变更自动同步、分布式架构等高级特性。配合 Flink 优秀的管道能力和丰富的上下游生态,Flink CDC 可以高效实现海量数据的实时集成。Flink CDC 社区发

    2024年02月04日
    浏览(51)
  • 【信息系统项目管理师】--【信息技术发展】--【新一代信息技术及应用】--【大数据】

      信息技术是在信息科学的基本原理和方法下,获取信息、处理信息、传输信息和使用信息的应用技术总称。从信息技术的发展过程来看,信息技术在传感器技术、通信技术和计算机技术的基础上,融合创新和持续发展,孕育和产生了物联网、云计算、大数据、区块链、人

    2024年03月14日
    浏览(53)
  • 如何构建新一代实时湖仓?袋鼠云基于数据湖的探索升级之路

    在之前的实时湖仓系列文章中,我们已经介绍了实时湖仓对于当前企业数字化转型的重要性,实时湖仓的功能架构设计,以及实时计算和数据湖结合的应用场景。 在本篇文章中,将介绍袋鼠云数栈在构建实时湖仓系统上的探索与落地实践,及未来规划。 数栈作为一个数据开

    2024年02月05日
    浏览(69)
  • Apache SeaTunnel:新一代高性能、分布式、海量数据集成工具从入门到实践

    Apache SeaTunnel 原名 Waterdrop,在 2021 年 10 月更名为 SeaTunnel 并申请加入 Apache孵化器。目前 Apache SeaTunnel 已发布 40+个版本,并在大量企业生产实践中使用,包括 J.P.Morgan、字节跳动、Stey、中国移动、富士康、腾讯云、国双、中科大数据研究院、360、Shoppe、Bilibili、新浪、搜狗、唯

    2024年02月03日
    浏览(64)
  • 云计算、大数据、人工智能、物联网、虚拟现实技术、区块链技术(新一代信息技术)学习这一篇够了!

    目录 云计算 一、云计算的基本概念 二、云计算的分类 (一) IaaS (二) SaaS (三) PaaS 三、云环境的分类、云计算的四种部署模式 (一)公有云 (二)私有云 (三)社区云 (四)混合云 四、云计算的特点 (一)虚拟化技术 (二)动态可扩展 (三)按需部署 (四)灵活性高 (五)可靠性高 (六)性价比高

    2024年02月04日
    浏览(102)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包