Dataphin数据中台使用

这篇具有很好参考价值的文章主要介绍了Dataphin数据中台使用。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一、产品功能介绍

二、dataphin使用介绍

1)dataphin注意事项

2)准备工作

3)规划数仓

4)数据处理以及配置调度

5)任务发布

6)数据抽取以及配置调度


一、产品功能介绍

Dataphin数据中台使用

二、dataphin使用介绍

1)dataphin注意事项

1).dataphin拥有开发/测试环境(XX_XX_XX_DEV)和生产环境(XX_XX_XX),使用Dev-Pord模式,将任务调度配置成功之后,进行发布,然后在发布模块,再次进行发布,该任务就会进入到生产

  2)dataphin将数据分为三层,分别是ODS层、CDM层、ADS层

        ODS层为原始数据层:所有一切的数据(使用到dataphin的数据)都将在这一层,管理员可以分配权限给用户,使用户可以看到自己所需要的数据,权限包括查看权限、数据从ODS到CDM曾的权限都需要通过管理员申请

        CDM层为数据汇总层:主要工作是做数据处理工作,处理完成之后将数据结果推送到ADS层,该层用户只能看到所在板块下的内容以及调度任务(注意:不同项目的调度任务在同一板块,也是可以看到的,eg:某项目在金融板块,看到自己调度任务的同时,也可以看到别的项目的调度任务)

        ADS层为数据应用层:将CDM层处理好的结果数据,配置调度任务抽取到ADS层(需要向超级管理员申请CDM表格的权限)

  3).dataphin拥有抽数取数的功能,可以配置调度,定时抽取数据(需要用户向超级管理员申请所申请表的操作权限)

  4).dataphin创建的表默认为分区表(分区字段默认为DS)

  5).数据开发、数据集成的操作,超级管理员都可以层层把控,用户必须有权限才能进行操作

2)准备工作

  1.  登录MaxCompute控制台,在左上角选择地域。

    Dataphin数据中台使用

  2. 在项目管理页签,单击创建项目。
  3. 在创建工作空间面板,配置创建DataWorks工作空间信息后,单击创建项目。

    Dataphin数据中台使用

  4. 在创建工作空间面板,配置创建MaxCompute项目信息后,单击确认创建,即可完成MaxCompute项目创建。
     

    Dataphin数据中台使用

  5. 创建成功后,即可在项目管理页签查看新创建的MaxCompute项目

    Dataphin数据中台使用

3)规划数仓

1.创建业务板块(没创建权限,故以下操作为官网推荐操作)

  1. 登录Dataphin控制台。
  2. 在Dataphin控制台页面,选择工作区地域后,单击进入Dataphin>>。
  3. 进入业务板块页面。
    1. 在Dataphin首页,单击顶部菜单栏的规划。
    2. 在规划页面,单击左侧导航栏的业务板块。
  4. 创建业务板块
    1. 在业务板块页面,单击右上方的新建业务板块。
    2. 在新建业务板块对话框,选择Dev-Prod模式后,单击下一步。
    3. 在新建业务板块对话框中,配置参数
    4. 单击确定,完成业务板块(LD_beginner_test和LD_beginner_test_dev)的创建。
  5. 创建交易域。
    1. 在LD_beginner_test业务板块页面,单击页面右侧的新建数据域。
    2. 在新建数据域对话框中,配置参数。

2.创建数据源

1.在规划页面,点击数据源,点击新建数据源

Dataphin数据中台使用

2.在新建数据源对话框中,配置参数,单机测试连接,连接成功之后,点击确定 

Dataphin数据中台使用

3.数据查询

1.点击资产进入地图页面

Dataphin数据中台使用

2.在搜索框模糊搜索表格点击相应的表格,即可查询表格相应内容(可以查看表结构、分区概览、数据预览、产出信息、血缘关系、影响分析、质量报告)

Dataphin数据中台使用

4)数据处理以及配置调度

数据处理主要分为CDM层数据处理和ADS层数据处理,在开发/测试环境任务发布成功之后,会自动发不到生产环境

1.CDM层数据处理

  1)点击研发,进入开发界面

Dataphin数据中台使用

  2)开发页面分为规范建模、数据处理、即席查询三大模块

规范建模主要是创建维度、物理逻辑表、业务逻辑表、原子指标、派生指标等内容

即席查询:(如图所示,可以看到相同板块下面不同操作人员的查询记录)

  点击即席查询,进入如下界面,可以用日常的sql就行查询数据,记忆逻辑处理

Dataphin数据中台使用

数据处理模块 

  1.用户可以在即席查询页面将数据处理逻辑处理好之后,在数据处理模块,进行任务调度

    点击数据处理→左侧列表“+”号(创建文件夹/创建maxcomper sql任务),也可以创建shell脚本

Dataphin数据中台使用

2.在创建好的sql文件中,可以编写sql处理逻辑,如下所示配置调度

  点击调度配置,在右侧列表选择时间属性、是否暂停调度、调度周期(最小粒度为5分钟)、上游依赖(需要管理员为你创建一个空节点作为cdm层的上游节点使用)、下游依赖(处理好的数据-->CDM层的目标表)

Dataphin数据中台使用

Dataphin数据中台使用

5)任务发布

1.如上所示点击右下角的确定保存目前的调度配置

2.点击如图所示的小飞机图标(右上角),提交任务  

Dataphin数据中台使用

  3.点击提交任务之后,会弹出提示框(确保无误之后点击确定即可)

Dataphin数据中台使用

  右上角会弹出该任务的备注信息,填写完毕之后,点击确认并提交

4.点击待发布对象列表,进入代发布对象列表

Dataphin数据中台使用

5.选中该任务名称左边的弹框,点击该任务右侧的发布,弹框会让你确定信息,点击确定即可

Dataphin数据中台使用

6.点击任务发布列表,进入任务发布列表页面,也可以点击该任务右侧的编辑,编辑任务,然后重新配置调度、发布任务

6)数据抽取以及配置调度

1.点击集成进入集成页面进行数据抽取和调度,如下所示:

Dataphin数据中台使用

2.在页面右侧组件库里面可以选择输入、转换、流程、输出等组件,按照自己的需求,完成对数据的抽取和输出工作

图中咱们输入选择maxcomputer、输出选择mysql为例

Dataphin数据中台使用

3.配置输入端maxcomputer

数据源(生产环境下的ADS层数据)、表(ADS层的应用表)、分区(bizdate→昨天、today→今天)

Dataphin数据中台使用

4.配置输出Mysql

数据源(代表创建的输出端的mysql数据源名称)、表(要导出的表名称)、加载策略(覆盖数据、追加数据)

字段映射将输入端和输出端字段映射完毕即可

Dataphin数据中台使用

填写准备语句和填写完成语句可以在准备导数或者导数完毕之后写sql操作导出的数据库表,点击确定即可,如下所示:

Dataphin数据中台使用

5.点击执行或者预览查看配置是否正确,数据是否导出成功(在mysql中查看)

6.配置调度信息,然后进行发布任务(发布任务同上)

 上游依赖(ads层该表的调度任务节点名称)、下游依赖(目前你在创建执行的该任务的节点名称)

Dataphin数据中台使用文章来源地址https://www.toymoban.com/news/detail-476149.html

到了这里,关于Dataphin数据中台使用的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 新年快乐—数睿通2.0数据中台全新功能模块发布

    离上次发文已经有接近三个月了,这三个月主要在开发数睿通的数据生产模块,同时优化了一下数据集成,目前已经基本开发完毕了,集成了 Flink,Hadoop,可以在线开发 FlinkSql 作业任务,同时支持 Sql 任务开发,使平台初步具备了拉数,造数的能力,正值新年,在这里给大家

    2024年02月02日
    浏览(49)
  • 各类云产品功能,适用场景介绍

    1.容器服务CCS(cloud container service) 2.容器服务CKE(Chinaunicom Kubernetes Engine) 3.镜像仓库CCR() 4.对象存储COS(Cloud Object Storage,COS) 对象存储(Cloud Object Storage,COS)是腾讯云提供的一种存储海量文件的分布式存储服务,用户可通过网络随时存储和查看数据。腾讯云 COS 使所有用户都能

    2024年01月16日
    浏览(34)
  • AI制图工具丨Midjourney产品功能介绍

    Midjourney是一款AI制图工具,只要,就能透过AI算法生成相对应的图片,只需要不到一分钟。 可以选择不同画家的艺术风格,例如安迪华荷、达芬奇、达利和毕加索等,还能识别特定镜头或摄影术语。 有别于谷歌的 Imagen和OpenAI的DALL.E,Midjourney是第一个快速生成AI制图并

    2024年02月16日
    浏览(40)
  • 【云开发笔记NO.22】运用云原生产品打造技术中台

    云原生产品以其容器化、微服务化、自动化等特性,为技术中台的建设提供了强大的技术支持。容器化技术使得应用可以更容易地进行部署和管理,提高了应用的可移植性和弹性。微服务架构则让应用更加模块化,便于独立扩展和维护。自动化工具则能够大大提升开发和运维

    2024年04月08日
    浏览(81)
  • Dataphin使用指南与开发流程

    相对前台与后台 相比数据仓库而言 数据仓库以数据为驱动自下而上设计 数据中台以业务为驱动 自上而下设计 数据仓库和传统的数据平台,其出发点为一个支撑性的技术系统,即一定要先考虑我具有什么数据,然后我才能干什么,因此特别强调数据质量和元数据管理;而数

    2024年02月16日
    浏览(36)
  • 【PCL自学:目录】PCL简介及主要功能模块介绍 (持续更新)

    当你知道一切都不重要时,世界就是你的了。 ——《瑞克和莫蒂》S3E8   对于从事计算机视觉、机器视觉领域的从业者来说,OpenCV库并不陌生,甚至是我们入门这个领域时的学习的第一个开源库,如果说OpenCV是二维信息处理方面的工兵铲,那PCL(Point Cloud Library)就是在三维

    2024年02月06日
    浏览(47)
  • 数据中台系列1:redis 安装使用之 windows 篇

    1、概述 redis官网上的安装包没有基于 window 系统的,但是有第三方开发的包,可以使用 redis,虽然版本低了点。因此,想在本机安装 redis 有以下办法: a、在 window 环境中安装低版本的 redis for window。因为作者已经不更新,所以支持的 redis 版本比较老。 b、在 window 环境中安装

    2024年02月14日
    浏览(38)
  • 数据中台系列2:rabbitMQ 安装使用之 window 篇

    RabbitMQ 是一个开源的消息队列系统,是高级消息队列协议(AMQP)的标准实现,用 erlang 语言开发。 因此安装 RabbitMQ 之前要先安装好 erlang。 1、安装 erlang 到 这里 下载本机能运行的最新版 erlang 安装包。如果本机没有装过 window 的 dll 库它会自动下载安装,因为是从网上下载好

    2024年02月14日
    浏览(47)
  • TipDM数据挖掘建模平台产品功能特点

    TipDM数据挖掘建模平台是可视化、一站式、高性能的数据挖掘与人工智能建模服务平台,致力于为使用者打通从数据接入、数据预处理、模型开发训练、模型评估比较、模型应用部署到模型任务调度的全链路。平台内置丰富的机器学习、深度学习、人工智能算法,可覆盖类别

    2024年02月11日
    浏览(66)
  • WMS产品实时数据仓库介绍

          目标以ERP、跨境电商ERP 、 WMS(仓储管理系统)为核心,搭建融合商业智能BI、新零售、订货系统等为一体的产品矩阵,帮助电商企业快速布局 跨境 和 新零售,提升订单处理效率,实现数字化业务管理,为企业降本增效。       Hologres是阿里巴巴自主研发的一站式

    2024年02月06日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包