Hadoop 存储占用分析命令,查看 Hdfs 文件夹占用大小

这篇具有很好参考价值的文章主要介绍了Hadoop 存储占用分析命令,查看 Hdfs 文件夹占用大小。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

兼职公司 Hadoop 运维之后,经常要解决 Hdfs 空间占用的问题,不知道哪天谁又在集群上留下一大堆缓存文件也不清掉,Hadoop 本身默认就是三副本,人一多每个人留一点结果占用了一堆的存储空间。

在 Linux 上游 du 这个指令可以很轻松的结合 sort 对文件夹的大小进行排序,分析,如下:

du -smh * | sort -h

[root@hadoop101 opt]# du -smh * | sort -h
154M	rh
1.2G	software
14G	module

在 Hdfs 上也支持使用 du 进行文件大小的分析,但是套用上面的模式,就会有些不兼容,所以我对这个指令的结果进行一定的处理,可以得到和上面一样的效果,在此记录一下供大家参考,具体的脚本如下

脚本名:./analyze_hdfs_files.sh

#!/bin/bash
hadoop fs -du -h ${1:?} | grep -E "M|G|T" | awk '{print $1$2"\t"$3$4"\t"$5}' | sort -h
  • 案例

例如:我想看一下 Hive 数据库下哪一个库,以及哪一个表的占用最大,可以像下面这样处理:

[root@hadoop101 opt]$ ./analyze_hdfs_files.sh /user/hive/warehouse
4.2T    12.8T   /user/hive/warehouse/tmp_table.db
9.0T    27.0T   /user/hive/warehouse/dws_table.db
161.2T  491.8T  /user/hive/warehouse/dw_table.db
228.0T  691.7T  /user/hive/warehouse/ods_table.db

可以看到 ods_table.db 数据库下的表是最大的,具体是哪一张表呢,可以继续深入:

[sunkangkang@fmidcslave01 scripts]$ ./analyze_hdfs_files.sh /user/hive/warehouse/ods_table.db | tail -3
189.8G  569.3G  /user/hive/warehouse/ods_table.db/ods_status_change
430.3G  1.3T    /user/hive/warehouse/ods_table.db/ods_locations
160.6T  481.7T  /user/hive/warehouse/ods_table.db/ods_log

这样就可以查到具体哪一张表的占用最大,类似的想要看哪个用户的存储占用,可以分析 /user 路线下的占用情况,而且这个脚本也可以兼容不同量级的存储大小,进行排序的时候,KB、MB、GB、TB 也是按顺序进行排列的。文章来源地址https://www.toymoban.com/news/detail-619185.html

到了这里,关于Hadoop 存储占用分析命令,查看 Hdfs 文件夹占用大小的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop:HDFS--分布式文件存储系统

    目录   HDFS的基础架构 VMware虚拟机部署HDFS集群 HDFS集群启停命令 HDFS Shell操作 hadoop 命令体系: 创建文件夹 -mkdir  查看目录内容 -ls  上传文件到hdfs -put 查看HDFS文件内容 -cat 下载HDFS文件 -get 复制HDFS文件 -cp 追加数据到HDFS文件中 -appendToFile HDFS文件移动 -mv  删除HDFS文件 -rm  

    2024年02月09日
    浏览(34)
  • HDFS Hadoop分布式文件存储系统整体概述

    整体概述举例: 包括机架 rack1、rack2 包括5个Datanode,一个Namenode( 主角色 )带领5个Datanode( 从角色 ),每一个rack中包含不同的block模块文件为 分块存储模式 。块与块之间通过replication进行 副本备份 ,进行冗余存储,Namenode对存储的 元数据进行记录 。该架构可以概括为一个 抽象

    2024年02月16日
    浏览(43)
  • 大数据:HDFS的Shell操作,进程启动管理,文件系统操作命令,创建文件文件夹,下载上传,复制移动,删除,展示,追加内容

    2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开 测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库 这oracle比sql安全,强大多了,所以你需要学

    2024年02月07日
    浏览(45)
  • 查看磁盘信息命令和查看目录以及文件占用空间大小命令

    记录 :313 场景 :在CentOS 7.9操作系统,查看磁盘信息命令、查看目录以及文件占用空间大小命令。主要是df、du、lsblk、fdisk、parted、pvdisplay、vgdisplay、lvdisplay、free等命令。 版本: 操作系统:CentOS 7.9 1.df命令 查看文件系统占用磁盘空间大小。df,disk free简称。 (1)查看帮助 命

    2024年02月07日
    浏览(35)
  • Hadoop的分布式文件存储系统HDFS组件的使用

    存储整个HDFS集群的元数据(metaData) —— 整个集群中存储的目录和文件的索引 管理整个HDFS集群 接收客户端的请求 负责节点的故障转移 存储数据,是以block块的形式进行数据的存放。 默认情况下block块的大小是128M。 blocksize大小的计算公式: 寻址时间:下载文件时找到文件

    2024年02月09日
    浏览(51)
  • Linux显示磁盘空间不足,/tmp文件夹占用100%问题分析和解决方案

            系统运行过程中发现无法上传文件,第一反应是磁盘空间不足导致,登录服务器后查看文件存放的空间充足,但是无法上传文件且命令行的tab键自动补充也提示空间不足。最后经过搜索和分析发现是/tmp 文件夹占用100%导致。以下记录分析和解决流程。         服

    2024年02月05日
    浏览(50)
  • 【linux命令】如何查看文件/文件夹所占空间大小

    使用 ls -lh 命令可以查看当前目录下所有文件的大小: 在上面的输出中,第一列是文件的权限和类型,第五列是文件大小。 使用 stat file1.txt 命令可以查看 file1.txt 文件的详细信息 在上面的输出中,第二行是文件大小。 使用 du 命令可以显示文件或目录的磁盘使用情况。你可以

    2024年02月14日
    浏览(48)
  • Hadoop中命令检查hdfs的文件是否存在

    在Hadoop中,可以使用以下命令检查HDFS文件是否存在: hadoop fs -test -e 其中,是要检查的HDFS文件的路径。 如果文件存在,命令返回0;如果文件不存在,命令返回非0值。 以下是一个示例: 示例中,使用hadoop fs -test -e命令检查/user/hadoop/myfile.txt文件是否存在。接着,通过检查命

    2024年02月14日
    浏览(37)
  • Linux查看磁盘、文件系统、文件夹、文件大小的命令(lsblk、df、du、ll)

    记录 :325 场景 :在CentOS 7.9操作系统上,使用lsblk命令查看磁盘大小和磁盘挂载情况;使用df查看文件系统大小和挂载情况;使用du命令查看文件夹(目录)大小;使用ll和ls查看文件大小。 版本: 操作系统:CentOS 7.9 1.lsblk常用命令 (1)帮助命令 命令:lsblk --help 功能:查看lsblk支

    2024年02月07日
    浏览(42)
  • Hadoop3教程(三):HDFS文件系统常用命令一览

    hdfs命令的完整形式: 其中subcommand有三种形式: admin commands client commands:如本节重点要讲的dfs daemon commands dfs(文件系统命令),这个是HDFS里,日常使用 最为频繁的一种命令 ,用来在HDFS的文件系统上运行各种文件系统命令,如查看文件、删除文件等。 基本语法: 这俩基本

    2024年02月06日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包