ChatGPT与数据库能擦出什么火花?

这篇具有很好参考价值的文章主要介绍了ChatGPT与数据库能擦出什么火花?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

ChatGPT与数据库能擦出什么火花?

ChatGPT,可以说是今年最火的一个科技名词。
随着这几个月的发展,我们看到有越来越多的ChatGPT与数据库结合的应用出现。
这也不禁令人畅想,未来ChatGPT与数据库的结合,能擦出什么火花?
DEV、DBA未来会失业吗?
本文尝试阐述下未来两者的结合前景。

 文章来源地址https://www.toymoban.com/news/detail-567086.html

一、ChatGPT为什么火

让我们先看看ChatGPT,是如何来解释自己的?

 

ChatGPT与数据库能擦出什么火花?

 

作为一个人工智能的外行,一直有点好奇,为什么ChatGPT的出现,能产生如此颠覆性的影响。可以说在过去几十年里,人工在很多领域都有不错的表现。从最早的IBM Watson,到近几年的Google AlphaGo,都在具备领域有所突破,但似乎都没有办法解决通用性问题,只能满足特定场景。因而人们常说,AI没有那么聪明。其背后的原理也查了查资料是因为让AI掌握常识,并且能够融会贯通地运用这些常识、形成推理能力非常难,一直以来这都是巨大的难题。

 

但这次以ChatGPT为代表的一众大语言模型,突然突破了这个门槛,变得非常“聪明”。当然背后的原因有很多,比如自监督学习、Fine-tuning策略等等,但有一个重要的底层变化——大语言模型的“涌现”现象,就是说一些业界从未想象到的能力,例如基础的社会知识、上下文学习、推理等等,在训练参数和数据量超过一定数值后,这些能力突然出现了,令AI一下子变得非常智能。伴随着这一技术突破,很多领域可采用新交付方式甚至是全面重塑。数据库作为重要的基础软件,也与其全面结合,产生很多新方向。

 

二、回顾AI与数据库的结合

在开始之前,先简单回顾下之前AI与DB之前的结合。下面部分内容摘自清华大学李国良教授团队论文《Database Meets AI:A Survey》。之前的数据库和人工智能的结合主要来自两个方面:一是人工智能可以使数据库更加智能化(AI4DB)。传统的经验数据库优化技术难以满足大规模数据库实例、各种应用程序和多样化用户的高性能要求,尤其是在云上。

 

而幸运的是,人工智能基于学习的技术可以缓解这个问题。二是数据库技术可以优化AI模型(DB4AI)。例如,人工智能很难在实际应用中部署,因为它需要开发人员编写复杂的代码和训练复杂的模型。数据库技术可用于降低使用人工智能模型的复杂性,加速人工智能算法,并在数据库中提供人工智能功能,其全貌如下。

 

ChatGPT与数据库能擦出什么火花?

 

这里我们重点关注AI4DB的方向。传统的数据库设计基于经验方法和规范,需要人工参与(例如DBA)来调整和维护数据库。人工智能技术被用来缓解这些限制,下图所示为机器学习能为数据库带来的一些技术突破:

 

ChatGPT与数据库能擦出什么火花?

 

其中的主要能力包括:参数调优、索引/视图顾问、SQL改写、成本估算、连接顺序优化等。从上述能力可见,AI4DB的方向重点是解决数据库运行问题,包括很多产品页都提出了“自治”、“自动驾驶”的概念。也就是说,是主要解决数据库自身问题。与之不同的是,ChatGPT更多是解决人与数据库间及数据自身的问题。

 

三、畅想ChatGPT与数据库结合

1.生成 SQL 语句(受益方:开发者、分析师)

 

这是目前最为常见的一类应用,将传统SQL语句编写,改为自然语言描述。通过这样的方式,降低数据库使用门槛,提升开发效率。主要受益的人群是数据库应用的开发者及数据探索者(如数据分析师)。很多产品纷纷集成了这一能力,如国内的NineData、Bytebase或者国外的sqlTranslate、AI2sql等。下面我们做个小测试,观察下ChatGPT能力(以下基于ChatGPT 3.5测试)。

 

 

 

通过这个简单例子,可以看出ChatGPT具备的能力。可将自然语言描述生成对应SQL。

 

2.性能优化(受益方:DBA、开发者)

 

ChatGPT另外一个能力,则是对数据对象或语句的优化能力。如下文是给出的一些通用性建议。

 

ChatGPT与数据库能擦出什么火花?

 

也可以根据具体语句,给出进一步优化建议:

 

ChatGPT与数据库能擦出什么火花?

 

当然上述优化建议还是比较通用的,当然针对具体对象的优化也是可以的。再如下文是对语句级提出的优化建议。

 

ChatGPT与数据库能擦出什么火花?

 

上述能力可以解决很多常规的性能问题,能大大简化开发者和初级DBA的很多工作,可以说能解决大部分的初级性能问题。

 

3.结构设计(受益方:DBA、开发者)

 

除了根据已有对象或语句完成优化提示外,ChatGPT还可以前置完成结构的设计。根据的简单的场景描述,给出数据库结构定义,简化结构设计工作。如下图就是一个简单登记学生成绩系统的库表设计。这其中包括了主要表、字段、约束等的定义,还是比较全的。

 

ChatGPT与数据库能擦出什么火花?

 

4.架构设计(受益方:DBA、架构师)

如果再进一步,将数据库架构设计也由ChatGPT完成如何?下图是我将上述例子场景提出,由ChatGPT提出推荐数据库选型。在明确使用AWS产品范围后,它给出了部分选型的建议。在给出一定性能要求后,甚至给出了推荐规格(db.r5.large)及潜在架构优化点(如读写分离)。

 

ChatGPT与数据库能擦出什么火花?

 

5.数据分析、挖掘与探索(受益方:数据分析师)

ChatGPT的一个很强能力在于对信息的理解,这一能力可利用在很多数据分析、挖掘、探索领域。其可以敏锐的洞察到数据的变化、甚至做一些趋势性的分析。如下图是国内各省份2021、2022年的GDP情况,可以这些信息可让ChatGPT估算今年的GDP。

 

ChatGPT与数据库能擦出什么火花?

 

6.数据治理(受益方:数据管理者、安全人员)

企业内包含着大量业务数据,如何有效利用数据,形成数据资产,进而发挥数据最大价值是企业管理者关心的问题。传统方式需要通过数据建模等手段自上而下完成治理动作,但受限于企业发展阶段、应用开发水平等因素,这种方式会存在很大推进难点。

 

ChatGPT提供了另外一种可能,即从数据本身含义理解做起,自下而上完成治理结构的构建。例如我们提供一组数据给ChatGPT,看它是符合判断数据属性的。

 

 

亦或是给出明确规则定义的情况下,判断数据质量问题。

 

 

ChatGPT与数据库能擦出什么火花?

 

四、总结

综上,ChatGPT在构建数据应用的全流程中均可发挥作用。从前期的架构、结构设计,到中期的应用开发与优化,再到后期的数据分析挖掘乃至数据治理领域。可以说覆盖了企业对数据及上层应用的方方面面。当然,除了简化开发外其他能力当前还稍显初级,但相信随着其技术本身的成熟及垂直领域的定向增强,未来构建全自动的数据应用将不是幻想。可能只需要提出一个业务Idea,后续从应用设计、开发,到资源选型、部署,再到应用运营分析等,都可以自助完成。

 

>>>>

参考资料

 

  • 上观新闻:人工智能技术并非新鲜事物,ChatGPT为何如此火?

    https://export.shobserver.com/baijiahao/html/587303.html

  • 清华大学李国良团队论文:Database Meets AI:A Survey

  • 光点科技:利用Chat GPT会在数据治理方面发挥哪些作用?

    https://baijiahao.baidu.com/s?id=1759949851524856806&wfr=spider&for=pc

 

整理丨韩锋

到了这里,关于ChatGPT与数据库能擦出什么火花?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【数据库】简单聊聊数据库可以做什么,有什么用?

    随着云计算和大数据的兴起,数据库的作用日益突出,因此了解什么是数据库,数据库可以做什么,有什么用是非常必要的。今天我们就来简单聊聊。 数据库是什么? 数据库是一个组织化的数据集合,用于存储大量的结构化数据。通过数据模型、数据结构和数据管理的概念

    2024年01月24日
    浏览(35)
  • ChatGPT,音乐,与数据库

    小编君是个不务正业,喜欢搞跨界,干啥啥不成的DBA,大概在十一年前就有个不成熟的妄念, 能否用计算机来写音乐? ▌ 用ChatGPT来搞音乐? 音乐是一个个的音符,按照乐理规则排列的。音符之间是否和谐,有精准的数学依据。比如各种和弦,都是和弦音的组成,然后配合

    2023年04月23日
    浏览(17)
  • 什么是数据库?数据库分为哪几种?

    一、什么是数据库?   数据库(Database)是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。(简而言之,用来存储大量数据的) 二、数据库分为那几种? 常用数据库有mysql、oracle、sqlse

    2024年02月07日
    浏览(29)
  • 【数据库】什么是 PostgreSQL?开源数据库系统

    PostgreSQL 是一个开源的对象关系数据库系统,本文,我们将讨论 PostgreSQL、它的用途和好处。 PostgreSQL 是由 PostgreSQL Global Development Group 开发的高级 开源关系数据库管理系统(RDBMS) 。它作为 POSTGRES 项目的一部分于 1986 年在加州大学伯克利分校启动,它最初于 1996 年 7 月 8 日发布

    2023年04月08日
    浏览(35)
  • 什么是向量数据库?向量数据库工作原理?向量数据库解决方案?

    向量数据库是一种专门用于存储和处理向量数据的数据库系统。向量数据是指具有多维度属性的数据,例如图片、音频、视频、自然语言文本等。传统的关系型数据库通常不擅长处理向量数据,因为它们需要将数据映射成结构化的表格形式,而向量数据的维度较高、结构复杂

    2024年02月15日
    浏览(42)
  • mysql面试题30:什么是数据库连接池、应用程序和数据库建立连接的过程、为什么需要数据库连接池、你知道哪些数据库连接池

    该文章专注于面试,面试只要回答关键点即可,不需要对框架有非常深入的回答,如果你想应付面试,是足够了,抓住关键点 数据库连接池是一种用于管理和复用数据库连接的技术。它是在应用程序和数据库之间建立一组数据库连接,并以池的形式存储起来,每当应用程序需

    2024年02月07日
    浏览(44)
  • 什么是 Java 中的数据库连接池?为什么使用连接池来管理数据库连接?

    数据库连接池(database connection pool)是在 Java 中用于管理数据库连接的一种技术。它的主要目的是提高数据库连接的重用性和性能。在传统的数据库连接方式中,每次与数据库建立连接时都需要进行一系列的网络通信和身份验证操作,这样的开销较大并且会影响应用程序的性

    2024年02月06日
    浏览(48)
  • 什么是矢量数据库?

    我们正处于人工智能革命之中。它颠覆了它所接触的任何行业,承诺了伟大的创新 – 但它也带来了新的挑战。对于涉及大型语言模型、生成式 AI 和语义搜索的应用程序,高效的数据处理变得比以往任何时候都更加重要。 所有这些新应用程序都依赖于向量嵌入,这是一种数据

    2024年02月15日
    浏览(46)
  • 数据库三范式是什么?

    数据库三范式(Normalization)是数据库设计中的一种规范标准,旨在减少数据冗余并建立结构合理的数据库,以提高数据存储和使用的性能。三范式是按照数据依赖性的程度来划分的,包括第一范式(1NF)、第二范式(2NF)和第三范式(3NF)。 第一范式要求关系型数据库中的

    2024年02月12日
    浏览(34)
  • Access数据库是什么

    数据是当今社会的命脉,因此自然而然地,很多注意力都集中在不同的数据库工具上。毕竟,如果用户有合适的工具,用户就有最有效的方法来处理当前的海量数据过剩问题,或许还能让整个过程变得更易于管理。为此,本文致力于对 Access 数据库进行介绍,该数据库常用于

    2024年02月04日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包