hadoop基础:通过 Shell 命令访问 HDFS

这篇具有很好参考价值的文章主要介绍了hadoop基础:通过 Shell 命令访问 HDFS。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.HDFS Shell概述

HDFS Shell 是由一系列类似 Linux Shell 的命令组成的。命令大致可分为操作命令管理命令其他命令三类

1.1操作命令

操作命令是以“hdfs dfs”开头的命令。通过这些命令,用户可以完成 HDFS 文件的复制、删除和查找等操作,Shell 命令的一般格式如下。

hdfs dfs [通用选项]

其中,hdfs 是 Hadoop 系统在 Linux 系统中的主命令;dfs 是子命令,表示执行文件系统操作;通用选项由 HDFS 文件操作命令和操作参数组成。
(1)创建文件夹
命令:hdfs dfs -mkdir [-p] <文件路径>
-p]:表示如果父目录不存在,先创建父目录。
例如,新建文件夹/202012721、/202012721/dir1。命令如下:

hdfs dfs -mkdir /202012721
hdfs dfs -mkdir -p /202012721/dir1

结果为:hadoop基础:通过 Shell 命令访问 HDFS

(2)列出指定的文件和目录
命令:hdfs dfs -ls [-d][-h][-R] <文件路径>
[-d]:返回 path。
[-h]:h 指“human-readble”,表示按照人性化的单位显示文件大小,比如文件显示为 10MB,
而不会显示 10240KB。
[-R]:级联显示 paths 下的文件。
例如,列出根目录下的文件或目录。命令如下:

hdfs dfs -ls /

结果为:
hadoop基础:通过 Shell 命令访问 HDFS

(3)新建文件
命令:hdfs dfs -touchz <存放路径>
例如,在主目录/202012721/input 下创建大小为 0 的空文件 file。命令如下:

hdfs dfs -touchz /202012721/input.txt
hdfs dfs -ls /202012721

结果为:
hadoop基础:通过 Shell 命令访问 HDFS

(4)上传文件
命令:hdfs dfs -put [-f] [-p] <本地路径> <HDFS上的路径> 或
hdfs dfs -copyFromLocal [-f] [-p] [-l] <本地路径> <HDFS上的路径> 在这里我们只演示第一个命令。例如,在本地创建一个文件 data.txt并传到HDFS的/202012721目录下命令如下:

hdfs dfs -put data.txt /202012721/data.txt

结果为:
hadoop基础:通过 Shell 命令访问 HDFS
(5)将本地文件移动到 HDFS
命令:hdfs dfs -moveFromLocal <本地文件路径> <HDFS路径> 。
与“hdfs dfs -copyFromLocal”命令不同的是,此命令将文件复制到 HDFS 后,本地的文件会被删除。
例如,我们把本地文件data2.txt移动到HDFS的/202012721命令如下:

hdfs dfs -moveFromLocal data2.txt /202012721 

结果为:
hadoop基础:通过 Shell 命令访问 HDFS
(6)下载文件
命令:hdfs dfs -get [-p] <HDFS路径> <本地文件路径> 或 hdfs dfs -copyToLocal [-p] [-ignoreCrc] [-crc] <HDFS路径> <本地文件路径>
例如,将 HDFS 中的/202012721/data.txt 文件下载并保存为本地的 ~/local_data.txt,将/202012721/data2.txt文件下载到本地目录。命令如下。

hdfs dfs -get /202012721/data.txt ~/local_data.txt
hdfs dfs -copyToLocal /202012721/data2.txt ~

(7)查看文件
命令:hdfs dfs -cat/text[-ignoreCrc] <文件路径>
hdfs dfs -tail [-f] <文件路径>
-ignoreCrc:忽略循环检验失败的文件。
-f:动态更新显示数据。
例如,查看/202012721/data.txt。命令如下。

hdfs dfs -cat /202012721/data.txt

结果为hadoop基础:通过 Shell 命令访问 HDFS

(8)追写文件
命令:hdfs dfs -appendToFile <本地路径> <目标路径>
该命令将 localsrc 指向的本地文件内容写入目标文件 dst。例如,在本地根目录下新建 data3.txt 文件,内容为”hadoop”,追加到文件/202012721/data.txt 中。命令如下。

hdfs dfs -appendToFile data3.txt /202012721/data.txt
hdfs dfs -cat /202012721/data.txt

结果为:hadoop基础:通过 Shell 命令访问 HDFS

(9)删除目录或者文件
命令:hdfs dfs -rm [-f] [-r] <文件路径>
-f:如果要删除的文件不存在,不显示错误信息。
-r/R:级联删除目录下所有的文件和子目录文件。
例如,删除 HDFS 中的/202012721/data2.txt 文件。命令如下。

hdfs dfs -rm /202012721/data2.txt

结果为:hadoop基础:通过 Shell 命令访问 HDFS

(10)显示占用的磁盘空间大小
命令:hdfs dfs -du [-s] [-h] <文件路径>
按字节显示指定目录所占空间大小。
-s:显示指定目录下文件总的大小。
-h:h 指“human-readble”,表示按照人性化的单位显示文件大小,比如文件显示为 10MB,而不会显示 10240KB。例如,显示 HDFS 根目录中 202012721 文件夹下所有文件的大小。命令如下:

hdfs dfs -du /202012721

结果为:
hadoop基础:通过 Shell 命令访问 HDFS

(11)HDFS 中的文件复制
命令:hdfs dfs -cp [-f] [-p | -p[topax]] <原路径> <目标路径>
-f:如果目标文件存在,将强行覆盖。
-p:将保存文件的属性。
例如,将 HDFS 中的/202012721/data.txt 复制为/202012721/data_copy.txt。命令如下。

hdfs dfs -cp /202012721/data.txt /202012721/data_copy.txt

结果为:hadoop基础:通过 Shell 命令访问 HDFS

(12)HDFS 中的文件移动(改名)
命令:hdfs dfs -mv <原路径> <目标路径>
例如,将 HDFS 中的/202012721/data_copy.txt 移动(也可理解为改名)为/202012721/data2.txt。命令如下。

hdfs dfs -mv /202012721/data_copy.txt /202012721/data2.txt

结果为:hadoop基础:通过 Shell 命令访问 HDFS

管理命令

管理命令是以“hdfs dfsadmin”开头的命令。通过这些命令,用户可以管理 HDFS。管理命令的一般格式如下:

hdfs dfsadmin [通用选项]

其中,hdfs 是 Hadoop 系统在 Linux 系统中的主命令;dfsadmin 是子命令,表示执行文件系统管理的操作;通用选项由 HDFS 管理命令和参数组成。
(1)报告文件系统的基本信息和统计信息
命令如下:

hdfs dfsadmin -report

结果如下:hadoop基础:通过 Shell 命令访问 HDFS

(2)查看拓扑
命令如下:

hdfs dfsadmin -printTopology

结果如下:
hadoop基础:通过 Shell 命令访问 HDFS

其他命令

我们把操作命令“hdfs dfs”、管理命令“hdfs dfsadmin”之外的命令称为其他命令。输入hdfs查看。文章来源地址https://www.toymoban.com/news/detail-402244.html

到了这里,关于hadoop基础:通过 Shell 命令访问 HDFS的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop HDFS分布式文件系统(介绍以及基础操作命令)

    目录 一、为什么需要分布式存储? 二、分布式的基础架构分析  三、HDFS基础架构 1.HDFS简介 四、HDFS集群启停命令 1.一键启停脚本 2.单进程启停 五、HDFS基本操作命令 1.创建文件夹  2.查看指定目录下内容  3.上传文件到HDFS指定目录下  4.查看HDFS文件内容 5.下载HDFS文件  6.拷贝

    2024年02月05日
    浏览(36)
  • 【Hadoop】-HDFS的Shell操作[3]

    目录 前言 一、HDFS集群启停命令 1.一键启停脚本可用 2.独立进程启停可用  二、文件系统操作命令 1、创建文件夹 2、查看指定目录下内容 3、上传文件到HDFS指定目录下  4、查看HDFS文件内容 5、下载HDFS文件 6、拷贝HDFS文件 7、追加数据到HDFS文件中 8、HDFS数据移动操作 9、HDFS数

    2024年04月26日
    浏览(32)
  • 0202hdfs的shell操作-hadoop-大数据学习

    以下命令执行默认配置了hadoop的环境变量,且使用新命令。 一键启停脚本 独立进程启停 2.1 HDFS文件系统基本信息 HDFS作为分布式存储的文件系统,有其对数据的路径表达式。如果熟悉Linux文件系统,可以对比学习。 HDFS同Linux系统一样,均是以/作为根目录的组织形式 如何区分

    2024年02月10日
    浏览(39)
  • 从零开始的Hadoop学习(五)| HDFS概述、shell操作、API操作

    1.1 HDFS 产出背景及定义 1) HDFS 产生背景 随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切 需要一种系统来管理多台机器上的文件 ,这就是分布式文件管理系统。 HDFS只是分布式文件管理系统

    2024年02月10日
    浏览(31)
  • HDFS操作常用的Shell命令

    目录 (1)   向HDFS 中上传任意文本文件,如果指定的文件在HDFS中已经存在,由用户指定是追加到原有文件末尾还是覆盖原有的文件; (2)   从HDFS中下载指定文件,如果本地文件与要下载的文件名称相同,则自动对下载的文件重命名; (3)   将HDFS中指定文件的内容输出到终端中

    2023年04月10日
    浏览(29)
  • 07-HDFS入门及shell命令

    是一种存储和组织数据的方法,它使得文件访问和查询变得容易 使得文件和树形目录的抽象逻辑概念代替了磁盘等物理设备使用数据块的概念,用户使用文件系统来保存数据不必关心数据底层存在硬盘哪里,只需记住这个文件的所属目录和文件名 文件系统通常使用磁盘和光

    2024年02月13日
    浏览(24)
  • 【Hadoop-HDFS】HDFS常用操作命令

    hadoop fs -ls / 普通创建: hadoop fs -mkdir /xiaolin 递归创建: hadoop fs -mkdir -p /xiaolin/xiaoyin mkdir xuan.txt hadoop fs -moveFromLocal xuan.txt /xiaolin hadoop fs -copyFromLocal xuan.txt / hadoop fs -put xuan.txt / 文件名称相同时覆盖hdfs上的文件: -f hadoop fs -put -f xuan.txt / hadoop fs -copyToLocal /xiaolin ./ hadoop fs -get

    2024年02月05日
    浏览(37)
  • Hadoop Hdfs基本命令

    1.hadoop 安装问题处理 2.hdfs 基本命令 3. 上传/下载文件和文件夹 1.hadoop安装问题处理 如果安装有进程无法启动,如下图 重新检查6个配置文件 Core-site.xml hdfs-site.xml hadoop-env.sh yarn-site.xml workers yarn-site.xml 来到hadoop313目录 清空data和yarndata 重新初始化 测试 2.hadoop hdfs基本命

    2024年02月11日
    浏览(31)
  • Hadoop-5-HDFS常用命令

    第一类:文件路径增删改查系列: hdfs dfs -mkdir dir 创建文件夹 hdfs dfs -rmr dir 删除文件夹dir hdfs dfs -ls 查看目录文件信息 hdfs dfs -lsr 递归查看文件目录信息 hdfs dfs -stat path 返回指定路径的信息 第二类:空间大小查看系列命令: hdfs dfs -du -h dir 按照适合阅读的形式人性化显示文件

    2024年02月09日
    浏览(35)
  • 实验二 HDFS的Shell命令操作,和HDFS的API操作

    来自博主卷毛迷你猪的授权 ,這是我的老師的博客多多關注 掌握 Hadoop 中 HDFS 的 Shell 命令操作 掌握 Hadoop 中 HDFS 的API操作  项目1:HDFS常见命令练习  项目2:HDFS命令的综合运用实践  项目3:HDFS的API使用实践  项目4:HDFS的API单元测试程序和更多思考(选做)  HDFS是

    2024年04月26日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包