AIGC 大模型纷纷部署,企业如何为 AI 数据降本增效

这篇具有很好参考价值的文章主要介绍了AIGC 大模型纷纷部署,企业如何为 AI 数据降本增效。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

编辑 | 宋慧

出品 | CSDN 云计算

AIGC 从年初开始持续爆火,国内各种大模型纷纷涌现,其中模型参数轻松突破千亿数量级。模型中数据的形态、部署也是多种多样的,庞大数据量背后的管理和成本不容小觑。

混合数据厂商肯睿 Cloudera 今年相继发布了系列的数据产品与方案,就是希望为所有 AI 与大模型的用户降低背后的数据成本。详细来说,Cloudera 建议用户重点去提高对数据的可观测性设计,并优化混合云的部署成本。另外对于 AI 场景的数据需求,用户可以重点关注湖仓一体的混合数据部署方式。

提升数据可观测性,优化混合云成本

经过十多年的 IT 改造和云化升级,采用混合云部署的模式正在逐渐普及和成为企业的重要选择。对于混合云场景,Cloudera 总结了三方面需要数据相关的技术团队去重点关注的工作。首先,在由容器、调度器、服务等复杂系统的混合云场景里,数据平台的可控和稳定性是第一重要的。另外,目前的管理系统对于云消耗情况和效率的可见性仍有限,所以常常会导致浪费和超支,因此技术团队需要重视对于数据底层的资源管理与控制工作。最后,对于数据系统运维来说,故障排除麻烦,提供支持的人员需要频繁地来回奔波,运维人员与平台系统的体验也是运维效率的重要保证。

因此,Cloudera 针对以上的重点技术问题,设计了可以覆盖整个 CDP 平台产品的一站式可观测性应用解决方案 Cloudera Observability。方案从财务视角、管理监控、性能优化、自动化分析等等方面去进行设计。具体功能与设计如下:

1、财务治理

  • 通过成本管理避免超出预算
  • 规划前的能力预测

2、主动系统监控

  • 关于基础设施、服务、工作负载和用户的历史分析报告
  • 当前系统监控和洞察

3、工作负载优化

  • 性能调校建议
  • 调节规则主动失效和刷新

4、服务健康监控

  • 通过连续服务监控确定瓶颈
  • 事件和日志与服务的关联性

5、自助式分析

  • 覆盖所有能力的自动化操作
  • 完整的影响分析和可见性

6、更快的问题解决速度

  • 随时可用的 RCA 和处方更快的支持速度

据介绍,目前 Cloudera Observability 已经支持了 Hive、Impala 和 Spark 等 CDP 的几个主要的数据引擎,并以 Cloudera 托管的 SaaS 形式提供服务,接下来 Cloudera Observability 还将推出可本地部署的版本。根据测算,采用 Cloudera Observability 之后,数据系统的集群利用率可提升 30%以上,SLA 和 SLO 遵守率可提高 43%,RCA 和故障排除速度加快 50 倍,从数据的效果可以看到可观测性技术对于基础设施的投资回报率、收入、运营开支都有非常显著的优化。

企业大模型的数据困境,Cloudera 湖仓一体给出新答案

除了对于数据的可观测技术,对于 AI 与大模型场景下的数据应用,数据系统也面临了与以往数据分析所不同的全新技术挑战,例如企业内部大模型训练所需数据的来源、准确性、安全性等等。

AIGC 大模型纷纷部署,企业如何为 AI 数据降本增效,大数据,大数据,Cloudera,CDP,AI,大模型

以大语言模型为例,对于 Spark、Hive 等系统下数据结构与性能等不同需求

详细来说:

1、数据背景信息缺失

  • 未在企业自身的数据上训练
  • 企业客户背景信息至关重要

2、数据的关联性与准确性

  • 错误的响应会带来严重的后果

3、数据的可信与安全

  • 针对意图而不是功能的新验证理念

4、数据风险与合规

  • 授权、溯源、治理审计追踪

Cloudera 已经积累了针对数据编织、湖仓一体、数据网格和未来数据生态系统架构要求的混合数据平台,基于混合云与多云部署,提供数据编制编排后,统一提供 AI、BI、机器学习等数据分析与应用产品。

AIGC 大模型纷纷部署,企业如何为 AI 数据降本增效,大数据,大数据,Cloudera,CDP,AI,大模型

今年 4 月 Cloudera 客户大会上 Cloudera 也重点强调了 Cloudera 混合数据平台 CDP 对数据科学与 AI、机器学习的支持。例如 Cloudera Machine Learning(CML)可以为机器学习生命周期提供端到端的工作流程支持,以及覆盖从数据专家到数据分析师等各类用户的协作式、一体化商业智能与增强功能。

针对企业训练和使用大模型对于数据的需求,Cloudera 也总结和分享了对应的产品与技术路线。目前已经分别从安全可信、混合数据应用、可扩展的三个方面提供技术能力。

AIGC 大模型纷纷部署,企业如何为 AI 数据降本增效,大数据,大数据,Cloudera,CDP,AI,大模型

具体来说:

1、可信、安全和治理。Cloudera SDX 提供在任何地点的企业数据上创建可信 AI 所需的安全、治理和溯源。

2、混合数据应用,利用企业已有数据打造企业 AI 应用。Cloudera 赋能各个公有云和私有云上的企业数据,通过与企业业务相关的背景信息增强企业 AI 技术能力。

3、增加数据可扩展性,为 ML/AI 应用提供数据基础。Cloudera 在云数据管理和分析领域所管理的数据超过 2500 万 TB,与超大规模云服务商不相上下。

数据的重要性,在 AI 时代将愈加突显。开发者对于数据的存储、管理、分析、应用将是重要的工作。Cloudera 对于数据系统的设计思路与建议,值得开发者重点关注,CSDN 将持续报道数据技术的进展。文章来源地址https://www.toymoban.com/news/detail-610277.html

到了这里,关于AIGC 大模型纷纷部署,企业如何为 AI 数据降本增效的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 英特尔集成显卡+ChatGLM3大语言模型的企业本地AI知识库部署

    作者: 英特尔创新大使 刘力 英特尔开发者技术推广经理 李翊玮     在当今的企业环境中,信息的快速获取和处理对于企业的成功至关重要。为了满足这一需求,我们可以将RAG技术与企业本地知识库相结合,以提供实时的、自动生成的信息处理和决策支持。这将有助于企业

    2024年04月26日
    浏览(52)
  • 数据湖如何为企业带来9%的高增长?可否取代数据仓库?

    什么是数据湖? 数据湖是一个集中的存储库,允许您以任何规模存储所有结构化和非结构化数据。您可以按原样存储数据,而不必首先构造数据,并运行不同类型的分析—从仪表板和可视化到大数据处理、实时分析和机器学习,以指导更好的决策。 为什么需要数据湖? 通过

    2024年02月15日
    浏览(42)
  • (十六) AIGC、AI绘画、SD-WebUI、本地部署、Stable-Diffusion本地模型、最新Controlnet扩展

    1、简介 AI绘画的工具网站很多,大部分收费/限制数量,而且速度很慢,如果部署本地的模型,不仅免费无限制、还可以提高出图效率,随意生成自己想象中的图,部署中发现有各种各样的环境配置问题,无法正确运行。 本博整理了SD-WebUI的整合包(Windows环境下),包括启动器

    2024年02月13日
    浏览(79)
  • 从大数据到AI,华为云存储加速企业大模型快速应用

    摘要: AI与大数据算法不断发展,在生产中的应用也越来越广,而应用的场景除了对算法,软件架构要求越来越高外,也对底层IaaS(基础设施即服务)提出了新的挑战。 AI与大数据算法不断发展,在生产中的应用也越来越广,而应用的场景除了对算法,软件架构要求越来越高

    2024年02月15日
    浏览(50)
  • 从 AI 增强到大模型,企业使用数据的方式又将如何变化?

    AI(Artificial Intelligence,人工智能)的发展不过百年,却已经深刻影响着人们的思维和见解,并逐渐关联到每个人生活和工作的方方面面。从最初的规则引擎和引入统计学方法,到基于知识表示和推理机制的专家系统,再到神经网络的提出助推大数据背景下深度学习和复杂 A

    2024年02月12日
    浏览(56)
  • 【AIGC调研系列】AIGC企业级模型Command-R介绍

    Command-R与其他大语言模型的主要区别在于其专为企业级应用设计,特别是在检索增强生成(RAG)和工具使用方面。Command-R是一个350亿参数的高性能生成模型,具有开放式权重,能够支持多种用例,包括推理、摘要和问答[2]。它特别针对大规模生产工作负载进行了优化,属于可

    2024年04月26日
    浏览(42)
  • AIGC革新浪潮:大语言模型如何优化企业运营

    在当今快速发展的商业环境中,企业对于有效管理知识资产的需求日益增长。知识管理作为企业核心竞争力的关键组成部分,对于提高决策质量、增强创新能力和优化运营流程起着至关重要的作用。随着数字化转型的推进,企业对知识管理系统提出了新的要求,期望其能够更

    2024年04月22日
    浏览(47)
  • AI学术界无人后继?高校毕业生纷纷进厂,全是香饽饽

    来源 | 新智元  微信号:AI-era 【导读 】近日,有外媒对一批美国名校的大学生和教授进行了采访。结果显示,高校毕业生入职科技公司已成主流。 AI火,搞AI的人就火。 这不,据Insider最近的一次采访报道,科技类公司正风卷残云般地从斯坦福、麻省理工、康奈尔大学等强

    2024年02月06日
    浏览(70)
  • 训练AI:从数据收集到模型部署的完整指南

    训练AI:从数据收集到模型部署的完整指南 随着人工智能的迅速发展,越来越多的企业、学术机构和开发者开始尝试训练自己的AI模型并将其应用于实际应用。但是,训练AI是一项复杂的工作,需要一定的编程和机器学习知识。在这篇文章中,我们将详细探讨从数据收集到模型

    2024年01月22日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包