以数仓视角切入学习路线,大数据真正需要学习的内容有哪些?

这篇具有很好参考价值的文章主要介绍了以数仓视角切入学习路线,大数据真正需要学习的内容有哪些?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

语数精选简介

语数精选来源于语数社区星球球友提问,主要沉淀一些大家工作和学习过程中存在的一些共性问题,希望能够更好的帮助到球友和粉丝。

本期精选问题

  • 作为数仓开发,需要学习哪些大数据基础知识?
  • 当整个数据链路过长时,如何进行模型优化?

站在数仓开发角度,大数据技术需要学哪些

语兴回答

以数仓视角切入学习路线,大数据真正需要学习的内容有哪些?,java,数据库,大数据,面试

  1. 语言层面(必学):java学习Java 的基础,多线程,反射,juc ,锁,内部类,代码块那些,都要好好掌握,还有几个类String 类,StringUntil 类,object 类,b站看韩顺平的课。

  2. 开源组件层面(选学):会用抽取工具完成日常数据同步(这里离线建议学sea tunnel或datax ,实时建议学flink cdc),调度工具(这里建议学dolphin scheduler或Azkaban),了解olap其中一种即可(这里查询olap建议学impala olap库建议学Doris)。

  3. 计算引擎(选学):如果有时间建议看看flink群里有flink基础学习资料,还有左哥这边提供的flink进阶讲解。

以数仓视角切入学习路线,大数据真正需要学习的内容有哪些?,java,数据库,大数据,面试

  1. 数仓建设思想(重中之重,必学):跟着我b站课程-数仓建设学习路线,了解数仓日常都在做什么,数仓版图有哪些内容,如何去做。

  2. 云端数据平台(选学):这里要了解平时开发流程步骤,如何操作等,到时候我会给你安排账号使用,结合着课程学习一周即可。

  3. 题(必学):由于你要准备校招,这里建议在java学会基础上把leetcode简单和中等的题刷一下,弄懂会写即可,投入70%,其次sql层面把踏踏实实练sql中带星号的题都弄懂会写,投入30%。

  4. 八股文(必学):把语兴小灶面试题带星的看懂,准备八股。

当数据链路比较长时,如何进行模型优化

语兴回答

球友提到:有时候加字段面对数据链路比较长的情况下,有什么好的模型优化方法没有(意思是链路过长可能dwd到dwd再到ads这类)

以数仓视角切入学习路线,大数据真正需要学习的内容有哪些?,java,数据库,大数据,面试

其实在生产环境dwd大多数都不同层依赖,ads下游存在相互依赖情况,但尽可能要避开,通过一个数据模型支持即可这里我提供一张图供大家参考,但dwd出现平层依赖情况就要考虑dwd表是否具备扩展性要不要重构。

我们可以从图中看到业务方想要的内容,他想让我们从ods补充字段然后添加到dwd然后在ads出标签,但后续他又会通过where处理或者引用也不做什么逻辑处理,增加多个下游表,其实后续的表价值也不大只是做了引用,所以建议无论是数仓内部同学开发还是数分做ads后续数据表处理如果没有任何大的标签变化(例如基于ads处理好的标签再做case when等判断)就不要往后继续开发数据表,如果业务方只是想过滤建议在看板侧过滤。

免费体系课:

  1. 数仓建设学习路线:https://space.bilibili.com/405479587/channel/collectiondetail?sid=995312

  2. 数仓建设实践路线:https://space.bilibili.com/405479587/channel/collectiondetail?sid=1191377

  3. 语兴小灶:https://space.bilibili.com/405479587/channel/collectiondetail?sid=1367677

  4. 踏踏实实练SQL:https://space.bilibili.com/405479587/channel/collectiondetail?sid=1077391

  5. 语兴的问题解答:https://space.bilibili.com/405479587/channel/collectiondetail?sid=1704755

  6. 实时专项(超哥讲解):https://space.bilibili.com/405479587/channel/collectiondetail?sid=1965322

关于语数

欢迎加入语数知识星球社区! 社区致力于推动数据技术的发展,为初学者和专业人士提供一个共享知识、经验和资源的社区平台,最重要一点,语数星球尊重原创,打造数据相关原创星球内容,跟随我们,脚踏实地一点一滴成长。

以数仓视角切入学习路线,大数据真正需要学习的内容有哪些?,java,数据库,大数据,面试

语数目前已更专项课程

  1. 语兴原创简历项目(目前已更新11个简历,可直接套用)
  2. 语兴的求职之路(手把手从简历->面试->入职后)
  3. 左美美:实时技术基础与源码剖析(flink专项作业)
  4. 左美美:Flink实时风控项目(flink体系课+作业)
  5. 超哥:平台研发技术(玩转平台开发)
  6. 汪哥:生产真实场景专项课程(生产真实场景剖析)
  7. 孟哥:数仓项目与面试(从面试官角度带你看项目)

欢迎感兴趣的同学咨询语数,语数每周都会安排直播,带你从更高层面,提升技术水平。文章来源地址https://www.toymoban.com/news/detail-843194.html

到了这里,关于以数仓视角切入学习路线,大数据真正需要学习的内容有哪些?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【大数据】大数据学习路线

    首先明确一点:大数据涉及的知识面广度还是有的,需要学习的组件繁多,想要每一项精通几乎不可能,所以企业在招聘的时候会进行细分,基于某个方向进行招聘,比如,数据仓库工程师、数据治理工程师、大数据开发工程师、大数据算法工程师、ETL工程师等。我们

    2024年01月18日
    浏览(26)
  • 大数据:【学习笔记系列】 Flink 学习路线

    Apache Flink 是一种高效、可扩展的 实时流处理框架 ,它允许开发者以 实时方式处理连续的数据流 。学习 Flink 要求你具备一定的编程基础(尤其是 Java 或 Scala),同时对大数据处理的基本概念有所了解。下面是一个详细的 Flink 学习路线,包括各阶段的学习目标和推荐资源。

    2024年04月23日
    浏览(24)
  • Python 数据分析学习路线

    在学习数据分析之前,首先需要掌握Python语言的基础知识,包括语法、常用数据结构、函数以及面向对象编程等。同时,还需要熟悉Python的标准库,如math、random、datetime等。此外,文件操作和异常处理也是必不可少的技能。在理论学习和实践项目的过程中,可以逐步深化对

    2024年02月08日
    浏览(29)
  • 大数据学习路线图(2023完整版)适合收藏

    大数据开发是一门涉及处理和分析大规模数据的技术领域,随着大数据技术的不断发展和应用,对大数据开发人员的需求也在逐渐增加。就业前景相对较好,尤其在科技行业和数据驱动型企业中。大数据开发的前景还是有很多优势的,就业范围广、薪资待遇高、公司私立待遇

    2024年02月12日
    浏览(35)
  • 大数据开发的学习路线是什么样的

    大数据技术的体系庞大且复杂,每年都会涌现出大量新的技术,目前大数据行业所涉及到的核心技术主要就是:数据采集、数据存储、数据清洗、数据查询分析和数据可视化。 学习大数据需要掌握什么语言基础? 1、Java基础 大数据框架90%以上都是使用Java开发语言,所以如果

    2024年02月14日
    浏览(28)
  • Redis学习路线(2)—— Redis的数据结构

    一、Redis的数据结构 Redis是一个Key-Value的数据库,key一般是String类型,不过Value的类型却有很多: String: Hello World Hash: {name: \\\"jack\\\", age: 21} List: [A - B - C - C] Set: {A, B, C} SortedSet: {A: 1, B: 2, C: 3} GEO: {A: (120.3, 30.5)} BitMap: 0110110101110101011 HyperLog: 0110110101110101011 由于Redis对数据

    2024年02月15日
    浏览(30)
  • ETF场内基金:AI量化投资最佳切入点(数据篇)

    原创文章第77篇,专注“个人成长与财富自由、世界运作的逻辑, AI量化投资”。 关于量化的基础知识,前面说得差不多了。 后面要开始实战。 量化的细分市场很多,如下图所示: 再从风险收益来看,从基金到加密货币,从“保守”到“激进”。 这里指的保守,当然是“主

    2024年01月21日
    浏览(39)
  • 大数据专业就业方向和考研院校及系统学习路线规划

    一、大数据的就业方向: 小标题 一、大数据专业的方向较多,以下是一些常见的方向: 1、数据挖掘与机器学习:主要关注数据的提取、处理、分析和预测,以及机器学习算法的应用。 2、大数据平台与分布式系统:主要关注大规模数据处理系统的构建和优化,包括Hadoop、

    2024年02月11日
    浏览(27)
  • Docker学习路线5:在 Docker 中实现数据持久化

    Docker 可以运行隔离的容器,包括应用程序和其依赖项,与主机操作系统分离。默认情况下,容器是临时的,这意味着容器中存储的任何数据在终止后都将丢失。为了解决这个问题并在容器生命周期内保留数据,Docker 提供了各种数据持久化方法。 Docker 卷 绑定挂载 Docker tmpfs

    2024年02月16日
    浏览(33)
  • SpringCloud学习路线(12)——分布式搜索ElasticSeach数据聚合、自动补全、数据同步

    一、数据聚合 聚合(aggregations): 实现对文档数据的统计、分析、运算。 (一)聚合的常见种类 桶(Bucket)聚合: 用来做文档分组。 TermAggregation: 按照文档字段值分组 Date Histogram: 按照日期阶梯分组,例如一周一组,一月一组 度量(Metric)聚合: 用以计算一些值,比如

    2024年02月15日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包