用加持了大模型的 Byzer-Notebook 做数据分析是什么体验

这篇具有很好参考价值的文章主要介绍了用加持了大模型的 Byzer-Notebook 做数据分析是什么体验。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Byzer-Notebook 是专门为 SQL 而研发的一款 Web Notebook。他的第一公民是 SQL,而 Jupyter 则是是以 Python 为第一公民的。 

随着 Byzer 引擎对大模型能力的支持日渐完善, Byzer-Notebook 也在不自觉中变得更加强大。我和小伙伴在聊天的过程中才发现他已经具备了如此强的能力。

为了节省大家时间,我们这里把文后涉及到的部分,提前做个总结,帮助您判断是不是要继续阅读下去。

在接下来的内容,我们描述如何在 Byzer-Notebook 中:

  1.  使用SQL加载市面主流数据源

  2.  对加载的数据进行混算

  3. 对SQL不熟悉,可以在Notebook中自己启动一个大模型,然后作为copilot使用

  4. 在 SQL 中可以调用大模型对数据做分析 

  5. 对最后的数据集使用 YAML 描述来做可视化生成

案例背景

今天假设我们有两个 csv 文件,我们需要加载这两个文件,并且做join,拼成一张完整的表,最后简单做个过滤,绘制一个可视化动图,并且使用大模型解读这个数据。

整个过程我们全部会使用 SQL 在 Byzer Notebook中完成。

Byzer Notebook 拥有业界一流的代码提示能力,所以你不要担心里面涉及到一些 SQL 扩展语法。

实现流程

首先是加载 csv 文件, Byzer 支持类似的语法加载市面上几乎所有主流数据源,诸如对象存储,MySQL/Oracle/DB2 等各种关系型数据库数据库,Hadoop文件系统等等。

代码如下,执行完后可以点击运行查看csv文件数据:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

按相同方式加载第二个文件:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

现在,我们想把两个表按 ID字段拼接成一个表,但是我对 SQL 不是很熟悉,不怕,我们在 Byzer Notebook中几乎可以部署所有主流开源模型和商业Saas模型。我最近用 Llama比较多,那我就启动一个 Llama 30B 的模型吧。只需要一条命令就可以完成这件事:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

指定下用多少个 GPU, 模型路径在哪即可。为了让大模型助手给我们生成靠谱点的SQL ,我们需要两张表的schema, 获取schema 在 Byzer 中很简单,用 !desc 命令即可:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

现在,我们可以问下我们刚才启动的大模型,你可以这么问:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

然后他会这样回复你:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

把这条SQL语句拷贝出来,然后加一个 as 表名,执行下:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

可以看到,数据拼接没啥问题。

现在我们希望使用大模型对这个数据集进行分析,第一步是要把数据集转化成json格式的文本,然后再给到大模型,假设我也不太会,但是我知道第一步是要把每一条记录里多个字段变成一个字段,所以我这么问大模型:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

 很棒,接着我再追问一句,是不是可以几万条记录合并成一条呀,我知道有个 collect_list 方法,但是我知道具体怎么用,那么可以继续追问:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

简单改造实际执行下:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

确实是work的。

恩,那现在开始对这个json字符串做个解读吧:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

这里有一些新函数,具体用法要参考下 Byzer 文档了,后续我们提供一个知道 Byzer 语言的大模型(经过我们微调),或者我们会知识库的方式提供对 Byzer 特有函数的一些解答。现在我们假设你辛苦参考文档写下了上面的那段SQL代码。

最后模型给我的回答出人意料,尼玛,丢了一个python 代码让我自己统计:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

好吧,算你知道自己是大模型,计算能力不咋地,Byzer Notebook 不但支持 Python解释器,而且还强大的一塌糊涂,所以我们直接在 Byzer Notebook 验证下大模型给的这段代码吧:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

这是最后的执行结果:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

 给的代码实际上有丢丢错误,不过难不倒我,调试通过了。

如果你不做计算,让他给个简单解读,也开始可以的:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

每个字段的含义都解读很准确,并且还罗列了自然灾害的类型等等。还是很不错的。

好了,大模型解读完毕,该做可视化了。先对数据简单做个过滤:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

然后做可视化:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

Byzer 使用 YAML 格式描述可视化。还是很简单的,大家看着文档复制黏贴就可以。

最后结果如下:

用加持了大模型的 Byzer-Notebook 做数据分析是什么体验,数据分析,数据挖掘

该图会根据时间自动变化,还是很酷的吧。

总结

可以看到, Byzer Notebook可以使用大模型做copilot 辅助我们写SQL ,也可以直接在 SQL 中使用大模型对数据进行分析处理。实际上 Byzer 的能力远不止如此,你还可以使用SQL 对大模型做预训练,微调,我们也提供了对SQL极大的工程增强,诸如模块化,模板,条件分支等特性的支持。

欢迎大家进入 Byzer SQL 的世界。

另外今天讲的案例,单纯的可视化版本我们可以看看我们早先的视频版讲解:文章来源地址https://www.toymoban.com/news/detail-663518.html

到了这里,关于用加持了大模型的 Byzer-Notebook 做数据分析是什么体验的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 在git使用时不小心commit了大文件,如何删除commit中的大文件记录

    问题背景:由于许多人在使用git命令的时候,习惯于使用 git add . 添加所有更改的命令,这个习惯会导致在进行git 进行push的时候,由于无意间提交commit缓存的大文件,阻止正常的push 从而很难解决,本文为了解决这问题,有以下小经验(文章广泛参考了其他帖子) 如果你也因

    2024年02月16日
    浏览(42)
  • AIGC 加持 Cocos,游戏开发需要几步?

    近日,游戏行业知名的 B2B 大会 WN 2023 大会于土耳其首都伊斯坦布尔顺利举办。本次大会邀请了来自全球的游戏开发商、媒体、发行商、分发平台等行业决策者,共同探讨游戏行业未来发展态势,进一步拓展业务,并在世界范围内寻找新的合作伙伴,Cocos 受邀出席本次大会。

    2024年02月09日
    浏览(75)
  • 【云原生与5G】微服务加持5G核心网

    作者:柒号华仔 个人主页:欢迎访问我的主页 个人信条:星光不问赶路人,岁月不负有心人。 个人方向:专注于5G领域,同时兼顾其他网络协议,编解码协议,C/C++,linux等,感兴趣的小伙伴可以关注我,一起交流。 1.1 单体架构与分布式架构   谈到微服务架构,不可避免的

    2023年04月09日
    浏览(33)
  • EHS管理系统为何需要物联网的加持?

    EHS是Environment、Health、Safety的缩写,是从欧美企业引进的管理体系,在国外也被称为HSE。EHS是指健康、安全与环境一体化的管理。 而在国内,整个EHS市场一共被分成三类; 一类是EHS管培体系,由专门的EHS机构去为公司的安全管理结构做培训、改进和更正。这一类的管培方式可

    2024年01月23日
    浏览(48)
  • AI 3D结构光技术加持,小米引领智能门锁新标准

    一直以来,小米智能门锁系列产品让更多家庭走进了安全便捷的智能生活,安全至上的设计让很多家庭都轻松告别了随身钥匙。 7月27日,小米正式推出 小米智能门锁M20 Pro ,再一次引领智能门锁产品的发展潮流。该款门锁采用AI 3D结构光技术,通过30000个采集点抓取面部细节

    2024年02月13日
    浏览(52)
  • 任务12、Quality指令加持,Midjourney生成电影级数码作品

    本次实验任务旨在帮助你掌握Midjourney AI绘画中的Quality指令。通过深入介绍Quality指令的概念和作用,我们将解释为什么它在绘画中至关重要。通过测试不同的Quality参数对绘画效果的影响,并提供实战演示,你将学会如何在Midjourney中设置Quality参数以达到更好的绘画质量。 本次

    2024年02月13日
    浏览(41)
  • 新技术加持下前端程序猿的未来在哪里?

    随着新技术的不断涌现,前端开发工程师的工作方式及内容也在不断演进。未来,前端开发工程师需要持续学习和更新自己的技能,以跟进技术的持续发展。 在新技术加持下,前端开发工程师的未来主要取决于以下几个方面: 更加智能化的UI设计。人工智能、机器学习等技术

    2024年02月02日
    浏览(60)
  • 多项创新技术加持,实现零COGS的Microsoft Editor语法检查器

    编者按:Microsoft Editor 是一款人工智能写作辅助工具,其中的语法检查器(grammar checker)功能不仅可以帮助不同水平、领域的用户在写作过程中检查语法错误,还可以对错误进行解释并给出正确的修改建议。神经语法检查器模型是这款提供了强大拼写检查和语法纠正服务的

    2024年02月08日
    浏览(53)
  • AI算法&图形化编程加持|OPT(奥普特)智能相机轻松适应各类检测任务

    OPT(奥普特)基于SciVision视觉开发包,全新推出多功能一体化智能相机,采用图形化编程设计,操作简单、易用;不仅有上百种视觉检测算法加持,还支持深度学习功能,能轻松应对计数、定位、测量、识别及缺陷检测等各类复杂应用场景。 高性能光学配件,成像出色 OPT

    2024年02月14日
    浏览(33)
  • NotionAI - 文档领域的ChatGPT,一款 AI 加持的在线文档编辑和管理工具

    NotionAI - 文档领域的ChatGPT,一款 AI 加持的在线文档编辑和管理工具 作为国际领先的在线文档编辑和管理工具,Notion受到了广大用户的欢迎,尤其是程序员们。它不仅支持笔记、编码等基本的在线文档功能,还支持团队协作、项目管理等能力,功能十分强大。 notion 不仅有WE

    2024年02月06日
    浏览(76)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包