Databend v1.1 版本发布!

这篇具有很好参考价值的文章主要介绍了Databend v1.1 版本发布!。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

各位社区小伙伴们,Databend 于 2023 年 4 月 14 日迎来了 v1.1.0 版本的正式发布! 这次新版本是 Databend 发布1.0 版本之后的第一个大版本!相较于 v1.0.0 版本,开发者们一共新增了 1,616 次commit, 共计 505 个优化和修复,涉及 2,069 个文件变更,约 16 万 行代码修改。感谢各位社区伙伴的参与,以及每一个让 Databend 变得更好的你!

在 v1.1.0 版本中,我们为 COPY INTO 支持了基本的 ETL 能力,在数据导入过程中即可轻松转换数据;Databend 现在能够成功运行所有 TPC-DS 查询,此外,还进行了一些性能优化和功能改进。

Databend x 内核

Databend 重要新特性速览,遇到更贴近你心意的 Databend 。

COPY INTO 支持 ETL 能力

COPY INTO 是 Databend 跨多云数据导入的重要路径,现在,它也具备基本的数据转换能力,避免在临时表中存储预转换数据,并支持列重新排序、列省略和基于 SELECT 的转换查询。

  CREATE TABLE my_table(id int, name string, time date);

  COPY INTO my_table
  FROM (SELECT t.id, t.name, to_date(t.timestamp) FROM @mystage t)
  FILE_FORMAT = (type = parquet) PATTERN='.*parquet';

这一功能可以帮助你简化 ETL 工作流,从而更专注于数据分析。

Docs - Load Data | Transforming Data During a Load

支持全部 TPC-DS 查询

Databend 现已支持全部 99 条 TPC-DS 查询!

TPC-DS 是一个面向决策支持系统的包含多维度常规应用模型的决策支持 benchmark ,它对决策支持系统的几个普遍适用方面进行建模,包括查询和数据维护。TPC-DS 被广泛用于衡量决策支持和分析系统的性能。

Blog - Benchmarking TPC-DS with Databend

REPLACE INTO

Databend 现在支持使用 REPLACE INTO 语句插入或更新数据。该语句允许你指定一个冲突键(conflict key),用于判断是应该插入一行新数据,还是更新一行已有数据。

如果表中已经存在与冲突键相同的行,Databend 会用新数据更新这一行。否则,新数据会作为一行新记录添加到表中。你可以使用这个语句来轻松地同步不同来源的数据或处理重复记录。

#> CREATE TABLE employees(id INT, name VARCHAR, salary INT);
#> REPLACE INTO employees (id, name, salary) ON (id) VALUES (1, 'John Doe', 50000);
#> SELECT  * FROM Employees;
+------+----------+--------+
| id   | name     | salary |
+------+----------+--------+
|    1 | John Doe |  50000 |
+------+----------+--------+
  • Docs - DML Commands | REPLACE

Window Function

窗口函数(Window Function) 为每行数据进行一次计算:输入多行(一个窗口)、返回一个值。在报表等分析型查询中,窗口函数能优雅地表达某些需求,发挥不可替代的作用。

  -- use aggrerate window function
  SELECT date, AVG(amount) over (partition by date)
  FROM BookSold

  June 21|544.0
  June 21|544.0
  June 22|454.5
  June 22|454.5
  June 23|643.0
  June 23|643.0

聚合窗口函数可以将聚合运算应用于窗口中的每一行数据。Databend 所支持的所有聚合函数都可以作为聚合窗口函数使用。

Docs - SQL Functions | Window Functions

Databend x 生态

Databend 的生态版图得到了进一步的完善。是时候将 Databend 引入你的数据洞见工作流啦!

可视化大盘

Metabase、Redash 和 Grafana 都是开源的可视化工具,能够从多个数据源中查询数据并将其可视化。

Databend 现在提供对上述三种工具的支持。你可以使用 Databend 作为数据源,利用这三种工具轻松构建可视化大盘,更好地理解和分析你的数据。

Databend v1.1 版本发布!

Docs - Data Visualization | Metabase

Docs - Data Visualization | Redash

Docs - Data Visualization | Connecting Databend With Grafana

编程语言支持

除了支持 Python、Go、Java 之外,Databend 现在还拥有自己的 Rust driver。这意味着你可以使用 Rust 轻松连接 Databend 并执行 SQL 查询。

  use databend_driver::new_connection;

  let dsn = "databend://root:@localhost:8000/default?sslmode=disable";
  let conn = new_connection(dsn).unwrap();

  let sql_create = "CREATE TABLE books (
      title VARCHAR,
      author VARCHAR,
      date Date
  );";
  conn.exec(sql_create).await.unwrap();

crates.io - databend-driver

Databend x AI

当云数仓遇到当下最热的大模型会擦出怎样的火花?Databend 与 OpenAI 联乘,让生产力多一点 AI 。

AI Functions

Databend 现在内置实用 AI 函数 ai_to_sql,支持将自然语言转换为 SQL 语句,轻松为复杂分析任务编写高质量的 SQL 。

  SELECT * FROM ai_to_sql(
      'List the total amount spent by users from the USA who are older than 30 years, grouped by their names, along with the number of orders they made in 2022');

另外,Databend 还支持文本 embeding 生成、相似度检索、文本补全等能力,一站式轻松构建基于 SQL 查询、由 AI 赋能的生产力工具。

  SELECT doc_id, text_content, cosine_distance(embedding, ai_embedding_vector('What is a subfield of artificial intelligence?')) AS distance
  FROM embeddings
  ORDER BY distance ASC
  LIMIT 5;

  SELECT ai_text_completion('Artificial intelligence is a fascinating field. What is a subfield of artificial intelligence?') AS completion;

Docs - SQL Functions | AI Functions

AskBend

不如问问神奇海螺吧!Databend 现在上线 AskBend 知识库问答系统,可以在线问答关于 Databend 的一切。

Databend v1.1 版本发布!

 文章来源地址https://www.toymoban.com/news/detail-419625.html

P.S. AskBend 现已开源,由 Databend Cloud 和 AI Functions 强力驱动,你也可以使用 Markdown 文件创建并部署自己的智能小助手。

AskBend - asking for Databend documentation

Github - datafuselabs/askbend

下载使用

如果你对我们新版本功能感兴趣,欢迎来 Release v1.1.0 · datafuselabs/databend · GitHub 页面查看全部的 changelog 或者 下载 release 体验。

如果你还在使用旧版本的 Databend,我们推荐升级到最新版本,升级过程请参考:

Upgrading Databend | Databend

意见反馈

如果您遇到任何使用上的问题,欢迎随时通过 GitHub issue 或社区用户群中提建议

GitHub: GitHub - datafuselabs/databend: A modern cloud data warehouse focusing on reducing cost and complexity for your massive-scale analytics needs. Open source alternative to Snowflake. Also available in the cloud: https://app.databend.com

致谢

最后感谢参与新版本设计开发,测试,文档贡献的开发者们。

Databend v1.1 版本发布!

关于 Databend


Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

👨‍💻‍ Databend Cloud:https://databend.cn

📖 Databend 文档:Databend - The Future of Cloud Data Analytics. | Databend

💻 Wechat:Databend

✨ GitHub:https://github.com/datafuselabs/databend


————————————————
版权声明:本文为CSDN博主「Databend」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/Databend/article/details/130009045

 

到了这里,关于Databend v1.1 版本发布!的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • JimuReport积木报表 v1.6.2 版本正式发布—开源免费的低代码报表

    项目介绍 一款免费的数据可视化报表,含报表和大屏设计,像搭建积木一样在线设计报表!功能涵盖,数据报表、打印设计、图表报表、大屏设计等! Web 版报表设计器,类似于excel操作风格,通过拖拽完成报表设计。 秉承“简单、易用、专业”的产品理念,极大的降低报表

    2024年02月03日
    浏览(26)
  • 云上数据变革:Databend Cloud 正式发布

    2023 年 4 月 20 日,【新一代云原生数据仓库 Databend Cloud 】线上发布会顺利举行。此次发布由北京数变科技有限公司【Databend Labs】联合阿里云共同举办。Databend Cloud 借助于云原生数仓 Databend 实现了云简单易用的大数据分析场景。 在过去的一年中,阿里云存储团队与云原生数仓

    2024年02月01日
    浏览(22)
  • 新增守护进程管理、支持添加MySQL远程数据库,支持PHP版本切换,1Panel开源面板v1.5.0发布

    2023年8月14日,现代化、开源的Linux服务器运维管理面板1Panel正式发布v1.5.0版本。 在这个版本中,1Panel新增了守护进程管理功能;支持添加MySQL远程数据库;支持添加FTP/S和WebDAV的SFTP服务;支持PHP版本切换。此外,我们进行了40多项功能更新和问题修复。1Panel应用商店也新增了

    2024年02月13日
    浏览(28)
  • 反控极域v1.0正式发布(开源)

    exe链接 GitHub - 反控极域v1.0 看完这篇的可以去看第二篇啦,这个1.0版本较旧没有2.0好用,发布在我个人主页里 本软件由 dh高中的无聊同学(划掉) 研发, 机房使用 极域课堂管理系统软件V6.0 2016 豪华版 软件功能: 1.给你的同学执行命令 2.给你的同学发送消息 3.看可爱的甘雨(

    2024年02月11日
    浏览(30)
  • 云原生周刊:Dapr v1.11 发布

    Kamaji Kamaji 可以大规模地部署和运行 Kubernetes 控制平面,而只需承担一小部分操作负担。Kamaji 的特别之处在于,控制平面组件是在一个单一的 pod 中运行,而不是在专用机器中运行。这种解决方案使运行多个控制平面的成本更低,更容易部署和操作。 Robusta KRR Robusta KRR(Kube

    2024年02月09日
    浏览(64)
  • DHorse v1.4.0 发布,基于 k8s 的发布平台

    新增特性 提供Fabric8客户端操作k8s(预览)的功能,可以通过指定-Dkubernetes-client=fabric8参数开启; Vue、React应用增加Pnpm、Yarn的构建方式; 支持Go、Flask、Django、Nuxt应用部署; 优化特性 副本指标数据保存为3天; 部署Nodejs应用时可以指定端口; 忽略搜索大小写匹配; 部署页面

    2024年02月07日
    浏览(17)
  • 云原生周刊:Kubernetes v1.28 正式发布 | 2023.8.21

    kurt 一个 Kubernetes 插件,可提供 Kubernetes 集群中重启内容的上下文信息。 Kubean Kubean 是一个基于 kubespray 的 Kubernetes 集群生命周期管理工具。 k8sgpt k8sgpt 是一款用简单的英语扫描 Kubernetes 集群、诊断和分流问题的工具。 它将 SRE 经验编入其分析器中,有助于提取最相关的信息,

    2024年02月11日
    浏览(26)
  • Microsoft发布用于 AutoML 算法和训练的 NNI v1.3

    将传统的机器学习方法应用于现实世界的问题可能非常耗时。自动化机器学习 (AutoML) 旨在改变这种状况——通过对原始数据运行系统流程并选择从数据中提取最相关信息的模型,使构建和使用 ML 模型变得更加容易。 为了帮助用户以高效和自动的方式设计和调整机器学习模

    2024年02月15日
    浏览(10)
  • JuiceFS 社区版 v1.1- Beta 发布,新增五个实用功能

    我们很高兴地宣布 JuiceFS v1.1-Beta 版本正式发布啦!这是一个功能丰富的版本,带来了许多实用的新功能和改进。在这个版本中我们新增了以下功能: 目录配额:为目录设置配额限制,控制其大小和文件数 目录克隆:快速地复制目录及其内容,节省时间和空间 一键恢复回收站

    2024年02月08日
    浏览(17)
  • 发布 VectorTraits v1.0,它是 C# 下增强SIMD向量运算的类库

    VectorTraits: SIMD Vector type traits methods (SIMD向量类型的特征方法). NuGet: https://www.nuget.org/packages/VectorTraits/1.0.0 源代码: https://github.com/zyl910/VectorTraits 总所周知,使用SIMD指令集,能够加速 多媒体处理(图形、图像、音频、视频...)、人工智能、科学计算 等。 然而,传统的SIMD编程存

    2024年02月09日
    浏览(26)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包