大数据课堂笔记 HDFS的shell操作

这篇具有很好参考价值的文章主要介绍了大数据课堂笔记 HDFS的shell操作。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、HDFS常用命令操作实战

启动Hadoop集群 执行命令   start-yarn.sh

大数据课堂笔记 HDFS的shell操作

 1.创建目录

(1).单层目录

执行命令  hdfs dfs -mkdir /ied

大数据课堂笔记 HDFS的shell操作

 利用WebUI查看创建的目录

大数据课堂笔记 HDFS的shell操作

(2).创建多层目录

执行命令  hdfs dfs -mkdir -p /luzhou/lzy

大数据课堂笔记 HDFS的shell操作

 利用WebUI查看创建的多层目录

大数据课堂笔记 HDFS的shell操作

 2.查看目录

执行命令  hdfs dfs -ls /         查看根目录              

大数据课堂笔记 HDFS的shell操作

 执行命令   hdfs dfs -ls /luzhou   

大数据课堂笔记 HDFS的shell操作

 3.上传本地文件到HDFS

创建 test.txt 文件  执行命令   echo “hello world” >test.txt

大数据课堂笔记 HDFS的shell操作

上传 test.txt 文件到HDFS的 /ied目录,执行命令  hdfs dfs -put test.txt /ied

大数据课堂笔记 HDFS的shell操作

 利用Hadoop WebUI界面查看是否上传成功

大数据课堂笔记 HDFS的shell操作

 4.查看文件内容

执行命令:hdfs dfs -cat /ied/test.txt

大数据课堂笔记 HDFS的shell操作

 5、下载HDFS文件到本地

 先删除本地的test.txt文件 执行命令:rm -rf  test.txt

大数据课堂笔记 HDFS的shell操作

下载HDFS文件系统的 /ied/test.txt 到本地当前目录不改名,执行命令:hdfs dfs -get /ied/test.txt

大数据课堂笔记 HDFS的shell操作

将HDFS上的文件下载到本地指定位置,并且可以更改文件名

执行命令:hdfs dfs -get /ied/test.txt /home/exam.txt

 大数据课堂笔记 HDFS的shell操作

检查是否下载成功

大数据课堂笔记 HDFS的shell操作

 6、删除HDFS文件

执行命令: hdfs dfs -rm /ied/test.txt

大数据课堂笔记 HDFS的shell操作

 检查是否删除成功

大数据课堂笔记 HDFS的shell操作

7.删除HDFS目录

执行命令:hdfs dfs -rmdir /luzhou

大数据课堂笔记 HDFS的shell操作

提示 -rmdir 命令删除不了非空目录

要递归删除才能删除非空目录:hdfs dfs -rm -r /luzhou(-r:recursive)

大数据课堂笔记 HDFS的shell操作

 删除空目录 /BigData 执行命令:hdfs dfs -rmdir /BigData

大数据课堂笔记 HDFS的shell操作

8、移动目录或文件

 将 /ied 目录更名为 /ied01,执行命令:hdfs dfs -mv /ied /ied01

大数据课堂笔记 HDFS的shell操作

 利用Hadoop WebUI查看是否更名成功

大数据课堂笔记 HDFS的shell操作

 将 /ied01/exam.txt 更名为 /ied/test.txt,执行命令:hdfs dfs -mv /ied01/exam.txt /ied01/test.txt

大数据课堂笔记 HDFS的shell操作

9、文件合并下载

现在 /ied01 里有一个 test.txt ,创建 sport.txtmusic.txt 并上传

大数据课堂笔记 HDFS的shell操作

合并/ied01目录的文件下载到本地当前目录的merger.txt

执行命令:hdfs dfs -getmerge /ied01/* merger.txt

大数据课堂笔记 HDFS的shell操作

查看本地的merger.txt,看是不是三个文件合并后的内容

大数据课堂笔记 HDFS的shell操作

10、检查文件信息

检查 test.txt 文件,执行命令:hdfs fsck /ied01/test.txt -files -blocks -locations -racks

大数据课堂笔记 HDFS的shell操作

执行命令:hdfs dfs -put /opt/hadoop-3.3.4.tar.gz /ied01,将hadoop压缩包上传到HDFS的/ied01目录

大数据课堂笔记 HDFS的shell操作

查看HDFS上 hadoop-3.3.4.tar.gz 文件信息,执行命令:hdfs fsck /ied01/hadoop-3.3.4.tar.gz -files -locations -racks

大数据课堂笔记 HDFS的shell操作

利用Hadoop WebUI来查看文件块信息更加方便,总共有6个文件块:Block0、Block1、Block2、Block3、Block4、Block5

大数据课堂笔记 HDFS的shell操作

 第1个文件块信息

大数据课堂笔记 HDFS的shell操作

 第6个文件块信息

大数据课堂笔记 HDFS的shell操作文章来源地址https://www.toymoban.com/news/detail-488423.html

到了这里,关于大数据课堂笔记 HDFS的shell操作的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【云计算与大数据概述 】课堂笔记

    1.1 云计算基础 1.1.1 云计算简介 云计算的技术内容包括分布式计算技术,虚拟化技术,网络技术,服务器技术,数据中心技术,云计算平台技术,存储技术等 云计算的定义:一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机和其他

    2024年02月06日
    浏览(46)
  • 云计算课堂笔记

    A,B,C:单播地址【一对一】   D:组播地址【广播】    E:保留地址【不让用】 主机位全0地址 代表网段--相当于一个网络范围 172.16.0.0【172是B类地址】   借位:借多少网段,就需要借几位【2的借位次方】 借的是主机位【 切蛋糕 】 192.168.1.0 24 24【3*8=24 255.255.255】 =192.168.1.

    2024年02月03日
    浏览(36)
  • 云计算课堂笔记——参考模型

    12.9参考模型 OSI(open system internet)七层参考模型(不管厂商怎么弄,就要按七层模型来弄(同一标准)) OSI/RM(参考模型) ISO--国际公有化组织——提出网络参考模型标准(统一标准) 分层的意义: 1.降低层次之间关联性,上一层都在下层基础上提供增值服务 2.大而化小的思

    2024年02月02日
    浏览(45)
  • 人工智能导论课堂笔记

    时间:2022年10月19日下午 班级:2022级人工智能应用技术1班 作业问题: Python安装注意事项 1.下载Python3.X的版本,如:3.10, 3.9, 3.8,不推荐下载2.7版本(已经不使用) 2.在命令行中,无法运行path-添加,需要知道安装的路径; Pycharm安装注意: 1.官网下载,推荐下载免费(社区

    2024年02月01日
    浏览(42)
  • mysql课堂笔记 mac

    目录 启动mac上的mysql 进入mysql mac windows 创建数据库 创建表 修改字段数据类型 修改字段名 增加字段 删除字段 启动mac上的mysql 直接输入你的开机密码即可。 编辑 进入mysql mac windows (root为你的用户名) 输入密码 创建数据库 创建表 示例: 没有加 ; 回车意味着这一句语句还没

    2024年02月09日
    浏览(35)
  • 03-JVM虚拟机-课堂笔记

    灵魂三问: JVM是什么? JVM广义上指的是一种规范。狭义上的是JDK中的JVM虚拟机。 为什么要学习JVM? 面试过程中,经常会被问到JVM。 研发过程中,肯定会面临一些重难点问题与JVM有关系。例如:线程死锁、内存溢出、项目性能优化等等。 基础不牢,地动山摇。想深入掌握

    2024年01月16日
    浏览(44)
  • 云计算与虚拟化技术【课堂笔记】

    鲲鹏产业学院 云计算与虚拟化技术 课堂笔记 目录 一、云计算系统及演进 云计算的定义 云计算的三个阶段 云计算的三种服务模式 云计算的四种部署模型 二、未完待续 总结          云计算的本质是一种服务提供模型 ,通过这种模型可以随时、随地、按需地通过网络访

    2024年02月01日
    浏览(48)
  • JSP_5.16_课堂笔记

    完整 的可以与 数据库 连接的 登录界面 的代码 1、加载驱动(告诉JDBC程序,连接的是哪一个数据库) Class.forName (“驱动程序名”); MySQL : com.mysql.jdbc.Driver com.mysql.cj.jdbc.Driver Oracle : oracle.jdbc.driver.OracleDriver SQL Server : com.microsoft.jdbc.sqlserver.SQLServerDriver 2、获取和数据库之间的连

    2024年02月05日
    浏览(40)
  • alibaba学习笔记03(小滴课堂)

    自定义Ribbon负载均衡策略实战 启动3个视频服务和一个订单服务: 我们可以看到它是随机调用的。 也可以使用其他负载均衡策略。 讲解新一代负载均衡组件feign介绍 这种方式去写死接口肯定是不妥当的。 于是我们使用feign负载均衡组件: 改造微服务 集成Feign实现远程方法调

    2024年01月19日
    浏览(41)
  • linux复习笔记01(小滴课堂)

           点击下一步在自定义硬件中: 我们可以删除我们不使用的,后续如果需要再加上即可。    然后我们就可以开启这台虚拟机了。 我们可以进行下载cetos7.   这里选择简体中文就可以。   时间的设置。   可以开启下网络。   在这里选择设置root密码,我设置的密码是

    2024年02月10日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包