【大数据】HDFS 的常用命令

这篇具有很好参考价值的文章主要介绍了【大数据】HDFS 的常用命令。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.操作命令

操作命令是以 hdfs dfs 开头的命令。通过这些命令,用户可以完成 HDFS 文件的 复制删除查找 等操作,Shell 命令的一般格式如下。

hdfs dfs [通用选项]

其中,hdfs 是 Hadoop 系统在 Linux 系统中的主命令;dfs 是子命令,表示执行文件系统操作;通用选项由 HDFS 文件操作命令和操作参数组成。

1.1 创建文件夹

hdfs dfs -mkdir [-p] <文件路径>
  • [-p]:表示如果父目录不存在,先创建父目录。

例如,新建文件夹 /202012721/202012721/dir1。命令如下:

hdfs dfs -mkdir /202012721
hdfs dfs -mkdir -p /202012721/dir1

结果如下:

hdfs创建文件命令,# Hadoop,大数据,hdfs,hadoop,常用命令,分布式文件系统,分布式

1.2 列出指定的文件和目录

hdfs dfs -ls [-d][-h][-R] <文件路径>
  • [-d]:返回 path
  • [-h]hhuman-readble,表示按照人性化的单位显示文件大小,比如文件显示为 10 MB,而不会显示 10240 KB。
  • [-R]:级联显示 paths 下的文件。

例如,列出根目录下的文件或目录。命令如下:

hdfs dfs -ls /

结果如下:

hdfs创建文件命令,# Hadoop,大数据,hdfs,hadoop,常用命令,分布式文件系统,分布式

1.3 新建文件

hdfs dfs -touchz <存放路径>

例如,在主目录 /202012721/input 下创建大小为 0 0 0 的空文件 file。命令如下:

hdfs dfs -touchz /202012721/input.txt
hdfs dfs -ls /202012721

结果如下:

hdfs创建文件命令,# Hadoop,大数据,hdfs,hadoop,常用命令,分布式文件系统,分布式

1.4 上传文件

hdfs dfs -put [-f] [-p] <本地路径> <HDFS上的路径>

或者

hdfs dfs -copyFromLocal [-f] [-p] [-l] <本地路径> <HDFS上的路径>

在这里我们只演示第一个命令。例如,在本地创建一个文件 data.txt 并传到 HDFS 的 /202012721 目录下命令如下:

hdfs dfs -put data.txt /202012721/data.txt

结果如下:

hdfs创建文件命令,# Hadoop,大数据,hdfs,hadoop,常用命令,分布式文件系统,分布式

1.5 将本地文件移动到 HDFS

hdfs dfs -moveFromLocal <本地文件路径> <HDFS路径> 

hdfs dfs -copyFromLocal 命令不同的是,此命令将文件复制到 HDFS 后,本地的文件会被删除。

例如,我们把本地文件 data2.txt 移动到 HDFS 的 /202012721 命令如下:

hdfs dfs -moveFromLocal data2.txt /202012721 

结果如下:

hdfs创建文件命令,# Hadoop,大数据,hdfs,hadoop,常用命令,分布式文件系统,分布式

1.6 下载文件

hdfs dfs -get [-p] <HDFS路径> <本地文件路径>

或者

hdfs dfs -copyToLocal [-p] [-ignoreCrc] [-crc] <HDFS路径> <本地文件路径>

例如,将 HDFS 中的 /202012721/data.txt 文件下载并保存为本地的 ~/local_data.txt

hdfs dfs -get /202012721/data.txt ~/local_data.txt

/202012721/data2.txt 文件下载到本地目录:

hdfs dfs -copyToLocal /202012721/data2.txt ~

1.7 查看文件

hdfs dfs -cat [-ignoreCrc] <文件路径>
  • [-ignoreCrc]:忽略循环检验失败的文件。
hdfs dfs -text [-ignoreCrc] <文件路径>
  • text 不仅可以查看文本文件,还可以查看压缩文件和 Avro 序列化的文件。
hdfs dfs -tail [-f] <文件路径>
  • [-f]:动态更新显示数据。
  • tail 查看的是最后 1 KB 的文件(Linux 上的 tail 默认查看最后 10 10 10 行记录)。

例如,查看 /202012721/data.txt。命令如下:

hdfs dfs -cat /202012721/data.txt

结果如下:

hdfs创建文件命令,# Hadoop,大数据,hdfs,hadoop,常用命令,分布式文件系统,分布式

1.8 追写文件

hdfs dfs -appendToFile <本地路径> <目标路径>

该命令将 localsrc 指向的本地文件内容写入目标文件 dst。例如,在本地根目录下新建 data3.txt 文件,内容为 hadoop,追加到文件 /202012721/data.txt 中。命令如下:

hdfs dfs -appendToFile data3.txt /202012721/data.txt
hdfs dfs -cat /202012721/data.txt

结果如下:

hdfs创建文件命令,# Hadoop,大数据,hdfs,hadoop,常用命令,分布式文件系统,分布式

1.9 删除目录或者文件

hdfs dfs -rm [-f] [-r] <文件路径>
  • [-f]:如果要删除的文件不存在,不显示错误信息。
  • [-r/R]:级联删除目录下所有的文件和子目录文件。

例如,删除 HDFS 中的 /202012721/data2.txt 文件。命令如下:

hdfs dfs -rm /202012721/data2.txt

结果如下:

hdfs创建文件命令,# Hadoop,大数据,hdfs,hadoop,常用命令,分布式文件系统,分布式

1.10 显示占用的磁盘空间大小

按字节显示指定目录所占空间大小。

hdfs dfs -du [-s] [-h] <文件路径>
  • [-s]:显示指定目录下文件总的大小。
  • [-h]hhuman-readble,表示按照人性化的单位显示文件大小,比如文件显示为 10 MB,而不会显示 10240 KB。

例如,显示 HDFS 根目录中 202012721 文件夹下所有文件的大小。命令如下:

hdfs dfs -du /202012721

结果如下:

hdfs创建文件命令,# Hadoop,大数据,hdfs,hadoop,常用命令,分布式文件系统,分布式

1.11 HDFS 中的文件复制

hdfs dfs -cp [-f] [-p | -p[topax]] <原路径> <目标路径>
  • [-f]:如果目标文件存在,将强行覆盖。
  • [-p]:将保存文件的属性。

例如,将 HDFS 中的 /202012721/data.txt 复制为 /202012721/data_copy.txt。命令如下:

hdfs dfs -cp /202012721/data.txt /202012721/data_copy.txt

结果如下:

hdfs创建文件命令,# Hadoop,大数据,hdfs,hadoop,常用命令,分布式文件系统,分布式

1.12 HDFS 中的文件移动

hdfs dfs -mv <原路径> <目标路径>

例如,将 HDFS 中的 /202012721/data_copy.txt 移动(也可理解为改名)为 /202012721/data2.txt。命令如下:

hdfs dfs -mv /202012721/data_copy.txt /202012721/data2.txt

结果如下:

hdfs创建文件命令,# Hadoop,大数据,hdfs,hadoop,常用命令,分布式文件系统,分布式

2.管理命令

管理命令是以 hdfs dfsadmin 开头的命令。通过这些命令,用户可以管理 HDFS。管理命令的一般格式如下:

hdfs dfsadmin [通用选项]

其中,hdfs 是 Hadoop 系统在 Linux 系统中的主命令;dfsadmin 是子命令,表示执行文件系统管理的操作;通用选项由 HDFS 管理命令和参数组成。

2.1 报告文件系统的基本信息和统计信息

hdfs dfsadmin -report

结果如下:

hdfs创建文件命令,# Hadoop,大数据,hdfs,hadoop,常用命令,分布式文件系统,分布式

2.2 查看拓扑

hdfs dfsadmin -printTopology

结果如下:

hdfs创建文件命令,# Hadoop,大数据,hdfs,hadoop,常用命令,分布式文件系统,分布式

3.其他命令

我们把操作命令 hdfs dfs、管理命令 hdfs dfsadmin 之外的命令称为其他命令。输入 hdfs 查看。文章来源地址https://www.toymoban.com/news/detail-755902.html

到了这里,关于【大数据】HDFS 的常用命令的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • hadoop调用HDFS java api实现在HDFS上创建文件夹

    目录 一、前期准备 1、Hadoop集群已配置完毕 2、Linux系统安装jdk 3、安装并破解IntelliJ IDEA 二、通过JAVA API操纵HDFS 1.在IDEA中创建项目  2.在hdfs项目的src-main-java路径下创建一个包,然后在包下创建一个java类实现hdfs的文件操作  3.java类的代码 4.对JAVA程序传入参数后运行程序  5

    2024年02月08日
    浏览(50)
  • Hadoop中命令检查hdfs的文件是否存在

    在Hadoop中,可以使用以下命令检查HDFS文件是否存在: hadoop fs -test -e 其中,是要检查的HDFS文件的路径。 如果文件存在,命令返回0;如果文件不存在,命令返回非0值。 以下是一个示例: 示例中,使用hadoop fs -test -e命令检查/user/hadoop/myfile.txt文件是否存在。接着,通过检查命

    2024年02月14日
    浏览(38)
  • Hadoop 存储占用分析命令,查看 Hdfs 文件夹占用大小

    兼职公司 Hadoop 运维之后,经常要解决 Hdfs 空间占用的问题,不知道哪天谁又在集群上留下一大堆缓存文件也不清掉,Hadoop 本身默认就是三副本,人一多每个人留一点结果占用了一堆的存储空间。 在 Linux 上游 du 这个指令可以很轻松的结合 sort 对文件夹的大小进行排序,分析

    2024年02月15日
    浏览(34)
  • Hadoop HDFS分布式文件系统(介绍以及基础操作命令)

    目录 一、为什么需要分布式存储? 二、分布式的基础架构分析  三、HDFS基础架构 1.HDFS简介 四、HDFS集群启停命令 1.一键启停脚本 2.单进程启停 五、HDFS基本操作命令 1.创建文件夹  2.查看指定目录下内容  3.上传文件到HDFS指定目录下  4.查看HDFS文件内容 5.下载HDFS文件  6.拷贝

    2024年02月05日
    浏览(36)
  • Hadoop大数据技术-通过shell命令访问HDFS

    HDFS shell大致可以分为操作命令、管理命令、其他命令三类。 注意:当命令以“$”开头时,当前用户为普通用户;以“#”开头时,当前用户为root用户。 操作命令是以“ hdfs dfs ”开头的命令,用户可以通过执行这些命令,完成对文件的查找、上传、删除等操作。 [-p]:表示如

    2023年04月11日
    浏览(32)
  • 大数据技术之Hadoop:使用命令操作HDFS(四)

    目录 一、创建文件夹 二、查看指定目录下的内容 三、上传文件到HDFS指定目录下 四、查看HDFS文件内容 五、下载HDFS文件 六、拷贝HDFS文件 七、HDFS数据移动操作 八、HDFS数据删除操作 九、HDFS的其他命令 十、hdfs web查看目录 十一、HDFS客户端工具 11.1 下载插件 11.2 本地安装Had

    2024年02月09日
    浏览(38)
  • 大数据 - Hadoop系列《五》- HDFS文件块大小及小文件问题

    系列文章: 大数据- Hadoop入门-CSDN博客 大数据 - Hadoop系列《二》- Hadoop组成-CSDN博客 大数据 - Hadoop系列《三》- HDFS(分布式文件系统)概述_大量小文件的存储使用什么分布式文件系统-CSDN博客 大数据 - Hadoop系列《三》- MapReduce(分布式计算引擎)概述-CSDN博客 大数据 - Hadoop系

    2024年04月24日
    浏览(40)
  • Hadoop -HDFS常用操作指令

    path 指定目录路径 -h 人性化显示文件size -R 递归查看指定目录及其子目录 -f 覆盖目标文件(已存在下) -p 保留访问和修改时间,所有权和权限。 localsrc 本地文件系统(客户端所在机器 ) dst 目标文件系统(HDFS) 下载文件到本地文件系统指定目录,localdst必须是目录 -f 覆盖目

    2024年02月10日
    浏览(34)
  • Hadoop Hdfs基本命令

    1.hadoop 安装问题处理 2.hdfs 基本命令 3. 上传/下载文件和文件夹 1.hadoop安装问题处理 如果安装有进程无法启动,如下图 重新检查6个配置文件 Core-site.xml hdfs-site.xml hadoop-env.sh yarn-site.xml workers yarn-site.xml 来到hadoop313目录 清空data和yarndata 重新初始化 测试 2.hadoop hdfs基本命

    2024年02月11日
    浏览(31)
  • Hadoop大数据从入门到实战(二)分布式文件系统HDFS

    头歌实践教学平台 教学课堂 大数据从入门到实战 - 第2章 分布式文件系统HDFS 任务描述 本关任务:使用 Hadoop 命令来操作分布式文件系统。 编程要求 在右侧命令行中启动 Hadoop ,进行如下操作。 在 HDFS 中创建 /usr/output/ 文件夹; 在本地创建 hello.txt 文件并添加内容:“ HDFS的

    2024年02月12日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包