关于大数据平台上任务管理的思考

这篇具有很好参考价值的文章主要介绍了关于大数据平台上任务管理的思考。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

本文于2019年7月16日完成,发布在个人博客网站上。
考虑个人博客因某种原因无法修复,于是在博客园安家,之前发布的文章逐步搬迁过来。


作业,比如提交一个hive脚本到计算平台上运行,这个脚本宏观上称为一个作业。
任务,比如mapper,reducer等。
资源,比如CPU时间,内存,硬盘IO,网络IO,墙钟等。

期望计算平台提供的信息,比如:

  1. 当前有哪些作业在运行。
  2. 作业占用的资源。
  3. 作业总共使用了哪些运算节点。
  4. 指定的作业使用了哪些节点,分别占用了多少资源。
  5. 每个节点上分配了哪些任务,分别占用了多少资源。
  6. 每个作业有多少stage,分别有多少任务,各占用多少资源。
  7. 各分类的排名。
  8. 各个mapper,reducer读入的数据量,输出的数据量。
  9. 数据表的访问频率,访问数据量。
  10. SQL的执行计划。

监控和通知,比如:

  1. 针对上述信息,例行发送指标值。
  2. 针对上述信息,定义阈值,当超出阈值,发送给指定的群组。
  3. 针对上述信息,提供趋势图,供指定人查看。
  4. 运行时占用资源多的作业,执行计划,输入数据量,输出数据量等。

日常工作中需要回答的问题:

  1. 计算平台的资源使用情况,有什么变化,变化趋势怎么样。
  2. 计算平台的资源使用情况是否合理。
  3. 计算平台是否需要扩容。
  4. 任务的数量,近期是否有什么变化。
  5. 任务处理的数据量,输出的数据量,是否有什么变化,变化的特点是什么,是否合乎业务特点。
  6. 任务占用的资源,是否有什么变化,变化的特点是什么。
  7. 任务运行时,stage,mapper,reducer的数量,使用的资源等,是否有什么变化,变化的特点是什么。
  8. 对于给定的某个作业,占用的资源是否充足或者过多。
  9. 对于给定的某个作业,对应的代码,是否需要优化,优化空间有多大。

分配资源的原则,充分利用资源,比如:

  1. 重点业务,优先保障。
  2. 非重点业务,合理安排调度启动时间,控制等待时间和墙钟时间。
  3. 监测资源瓶颈,避免争用。
  4. 制定扩容计划,及时实施。

有了上述数据,就有了调整资源的依据,减少无效的沟通,提高生活质量。文章来源地址https://www.toymoban.com/news/detail-777157.html

到了这里,关于关于大数据平台上任务管理的思考的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 关于图像分类任务中划分数据集,并且生成分类类别的josn字典文件

    在做图像分类任务的时候, 数据格式是文件夹格式,相同文件夹下存放同一类型的类别 不少网上的数据,没有划分数据集,虽然代码简单,每次重新编写还是颇为麻烦,这里记录一下 如下,有的数据集这样摆放: 可以看出这是个三分类任务,不过没有划分测试集、验证集

    2024年02月02日
    浏览(27)
  • 关于神经网络的思考

    感知机(Perceptron)和神经网络(Neural Network)之间有一定的关系,可以说感知机是神经网络的一个基本组成单元。 感知机 : 感知机是一种简单的二分类线性分类器。 它接受多个输入,对每个输入施加权重,然后将它们相加。这个总和会经过一个激活函数(通常是阶跃函数)

    2024年02月07日
    浏览(33)
  • 关于杂事的思考

    本文于2019年7月20日完成,发布在个人博客网站上。 考虑个人博客因某种原因无法修复,于是在博客园安家,之前发布的文章逐步搬迁过来。 之前参加部门的述职会议,有同事提出当前的 杂事 过多,影响效率。 杂事指的是啥呢? 这里说一下杂事的对立面,本职工作。 比如

    2024年02月03日
    浏览(33)
  • 关于账号安全的一些思考

    目录 声明 0x01-提升账号安全的目的 0x02-问题分析 1、攻击思路 1.1、页面关键点拆解 1.2、关于提升账号成本 2、攻击行为 3、黑产资源 维度1:资源 维度2:作弊工具 0x03-矛与盾 资源维度 1、IP资源 1.1、IP资源介绍 1.2、攻击方式 (1)IP池实现逻辑 (2)IP池页面展示 1.3、防御思路

    2023年04月10日
    浏览(29)
  • 关于推荐场景的一些思考

    由于用户数的飙升,推荐使用的技术栈也在不断升级,以满足更高并发和更大数据量的推荐场景。 推荐相关的原始数据从小几十万到几百万,到几千万,再到上亿。 从全库的用户数据中load出满足条件的用户,在jvm做计算,得到推荐结果。 随着用户数量的上升,满足条件的用

    2023年04月09日
    浏览(37)
  • 关于chatgpt的思考

    chatgpt的到来无疑类似瓦特发明了蒸汽机。 后者促成了工业革命。chatgpt也必将促成新的信息革命。 工业革命促成了非常多的大型工业企业。比如宝马,三星。掌握了动力,就可以替代大量的人力,并且完成很多需要使用非常多时间非常多力气才能完成的任务。快速学习机械知

    2024年02月02日
    浏览(35)
  • 关于花旗骰的思考

    CRAPS又称花旗骰,是美国拉斯维加斯非常受欢迎的一种的桌上赌博游戏。该游戏使用两粒骰子,玩家通过摇两粒骰子获得点数进行游戏。简单的规则是:玩家第一次摇骰子如果摇出了7点或11点,玩家胜;玩家第一次如果摇出2点、3点或12点,庄家胜;其他点数玩家继续摇骰子,

    2024年02月13日
    浏览(25)
  • 关于测试思维的个人思考框架

    以下是个人的思考框架,后续将在此基础上进行逐渐细化; 软件测试思维     先决认知         软件测试是一门技术 VS 软件测试是一门艺术             技术:可复制、可标准、可规模化             艺术:因人而不同,结果基本不可具化             比如做菜

    2023年04月08日
    浏览(36)
  • 关于Vue前端接口对接的思考

    Survive by day and develop by night. talk for import biz , show your perfect code,full busy,skip hardness,make a better result,wait for change,challenge Survive. happy for hardess to solve denpendies. 需求: 1.vue 组件分类和获取数值的方式 在Vue中,组件可以分为以下几种类型: 全局组件(Global Components):全局组件是在

    2024年01月23日
    浏览(38)
  • 关于大型客户端项目的思考

    a. 启动慢 b. 运行慢 c. 稳定性低 基于以上问题进行一些思考,最终总结出该方案. 当项目过大时,需要加载的程序集也越多,对应程序需要启动的时间也越长,如果在这个时候有一个启动的过渡页,从使用的角度看,能在启动后快速看到程序反应,则在某种程度上加快了程序的启动速度

    2024年02月08日
    浏览(27)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包