分布式文件系统使用——MinIO

这篇具有很好参考价值的文章主要介绍了分布式文件系统使用——MinIO。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

分布式文件系统使用——MinIO

1 分布式文件系统

1.1 概念

minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

  • 常见的文件系统:FAT16/FAT32、NTFS、HFS、UFS、APFS、XFS、Ext4等 。

现在有个问题,一此短视频平台拥有大量的视频、图片,这些视频文件、图片文件该如何存储呢?如何存储可以满足互联网上海量用户的浏览。
分布式文件系统就是海量用户查阅海量文件的方案。

通过概念可以简单理解为:一个计算机无法存储海量的文件,通过网络将若干计算机组织起来共同去存储海量的文件,去接收海量用户的请求,这些组织起来的计算机通过网络进行通信,如下图:
minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

分布式文件系统的好处:

  1. 一台计算机的文件系统处理能力扩充到多台计算机同时处理
  2. 一台计算机挂了还有另外副本计算机提供数据
  3. 每台计算机可以放在不同的地域,这样用户就可以就近访问,提高访问速度
总结:干活的人多、有副本、就近访问

1.2 常见的分布式文件系统

①NFS

类比网络上的共享文件夹方式

minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

1)在客户端上映射NFS服务器的驱动器。
2)客户端通过网络访问NFS服务器的硬盘完全透明。
②GFS(google)

主从结构:master、chunkserver

minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

1GFS采用主从结构,一个GFS集群由一个master和大量的chunkserver组成。
2)master存储了数据文件的元数据,一个文件被分成了若干块存储在多个chunkserver中。
3)用户从master中获取数据元信息,向chunkserver存储数据。
③HDFS

HDFS,是Hadoop Distributed File System的简称,是Hadoop抽象文件系统的一种实现。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。 HDFS的文件分布在集群机器上,同时提供副本进行容错及可靠性保证。例如客户端写入读取文件的直接操作都是分布在集群各个机器上的,没有单点性能压力。

minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

1HDFS采用主从结构,一个HDFS集群由一个名称结点和若干数据结点组成。
2) 名称结点存储数据的元信息,一个完整的数据文件分成若干块存储在数据结点。
3)客户端从名称结点获取数据的元信息及数据分块的信息,得到信息客户端即可从
数据块来存取数据。
④云计算厂家(类似:阿里的OOS)

阿里云对象存储服务(Object Storage Service,简称 OSS),是阿里云提供的海量、安全、低成本、高可靠的云存储服务。

百度对象存储BOS提供稳定、安全、高效、高可扩展的云存储服务。

⑤MinIO(去中心化)

MinIO 是一个非常轻量的服务,可以很简单的和其他应用的结合使用,它兼容亚马逊 S3 云存储服务接口,非常适合于存储大容量非结构化的数据,例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等。
它一大特点就是轻量,使用简单,功能强大,支持各种平台,单个文件最大5TB,兼容 Amazon S3接口,提供了 Java、Python、GO等多版本SDK支持。

2 MinIO教程

2.1 MinIO概念

MinIO是一个轻量级的服务,但是服务功能齐全,我们日常的小项目可以用它来做我们的分布式文件系统。

官网:https://min.io
中文:https://www.minio.org.cn/,http://docs.minio.org.cn/docs/

MinIO集群采用去中心化共享架构,每个结点是对等关系,通过Nginx可对MinIO进行负载均衡访问。

  • 在大数据领域,通常的设计理念都是无中心和分布式。Minio分布式模式可以帮助你搭建一个高可用的对象存储服务,你可以使用这些存储设备,而不用考虑其真实物理位置。
  • 它将分布在不同服务器上的多块硬盘组成一个对象存储服务。由于硬盘分布在不同的节点上,分布式Minio避免了单点故障。

结构图如下:
minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

  1. Minio使用纠删码技术来保护数据,它是一种恢复丢失和损坏数据的数学算法,它将数据分块冗余的分散存储在各各节点的磁盘上,所有的可用磁盘组成一个集合
  2. 使用纠删码的好处是即便丢失一半数量(N/2)的硬盘,仍然可以恢复数据。 比如上边集合中有4个以内的硬盘损害仍可保证数据恢复,不影响上传和下载,如果多于一半的硬盘坏了则无法恢复。
如上图,一共4个server,如果有1个server挂了,依然可以上传和下载文件,并且当挂
掉的server恢复后,会自动恢复数据。
"如果多于一半的server挂了,那么无法恢复",比如:如果有两个挂了,就算server重
新上线,也依然无法恢复数据,数据将无法同步,这对分布式文件系统DFS是致命的。

2.2 使用MinIO

从MinIO官网下载对应操作系统版本,这里以windows为例

①下载好后,创建存放文件的目标文件夹,进入MinIO的cmd执行以下命令

照理来说是应该有多台机器的,但是由于条件限制,采用创建几个文件夹来模拟分布式【大家可以通过虚拟机的方式模拟】

  • 此处我创建四个data文件:
    minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO
  • 执行命令完成映射:

minio.exe server D:\develop\minio_data\data1 D:\develop\minio_data\data2 D:\develop\minio_data\data3 D:\develop\minio_data\data4

minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

  • 输入url,进入minio的管理页面

复制上面cmd窗口中展示的任意一个url【端口为:9000】
例如:http://169.254.133.199:9000
用户名、密码默认都是:minioadmin

minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO
②创建bucket

下一步创建bucket,桶,它相当于存储文件的目录,可以创建若干的桶

minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO
③点击“upload”上传文件。
minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO
④观察本地四个data目录情况
minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

我们发现上传的1.mp4文件存储在了四个目录,即四个硬盘上。
下边测试minio的数据恢复过程:
1、首先删除一个目录。
删除目录后仍然可以在web控制台上传文件和下载文件。
稍等片刻删除的目录自动恢复。
2、删除两个目录。
删除两个目录也会自动恢复。
3、删除三个目录 。
由于 集合中共有4块硬盘,有大于一半的硬盘损坏数据无法恢复。
此时报错:We encountered an internal error, please try again. (Read failed. Insufficient number of drives online)在线驱动器数量不足。

2.3 Java操作MinIO

MinIO提供多个语言版本SDK的支持,下边找到java版本的文档:
地址:https://docs.min.io/docs/java-client-quickstart-guide.html
最低需求Java 1.8或更高版本:

2.3.1 导入依赖
<dependency>
    <groupId>io.minio</groupId>
    <artifactId>minio</artifactId>
    <version>8.4.3</version>
</dependency>
<dependency>
    <groupId>com.squareup.okhttp3</groupId>
    <artifactId>okhttp</artifactId>
    <version>4.8.1</version>
</dependency>

2.3.2 测试上传
  1. 创建bucket
    minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO
  2. 点击“Manage”修改bucket的访问权限,改为public
    minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO
    minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

public,任意人都可访问

  1. 创建一个路径:file【如果不创建,运行下面的代码会自动创建】
    minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

  2. 测试代码

package com.zi.test;

import io.minio.BucketExistsArgs;
import io.minio.MakeBucketArgs;
import io.minio.MinioClient;
import io.minio.UploadObjectArgs;
import io.minio.errors.MinioException;

import java.io.IOException;
import java.security.InvalidKeyException;
import java.security.NoSuchAlgorithmException;

/**
 * @author zhouYi
 * @description TODO
 * @date 2023/2/14 17:47
 */
public class MinIOTest {

    static MinioClient minioClient =
            MinioClient.builder()
                    //url先择任何一个server
                    .endpoint("http://169.254.133.199:9000")
                    //用户名密码
                    .credentials("minioadmin", "minioadmin")
                    .build();


    //上传文件
    public static void upload() throws IOException, NoSuchAlgorithmException, InvalidKeyException {
        try {
            boolean found =
                    minioClient.bucketExists(BucketExistsArgs.builder()
                            //选择testbucket
                            .bucket("testbucket").build());
            //检查testbucket桶是否创建,没有创建自动创建
            if (!found) {
                minioClient.makeBucket(MakeBucketArgs.builder().bucket("testbucket").build());
            } else {
                System.out.println("Bucket 'testbucket' already exists.");
            }
            //上传hello.txt
            minioClient.uploadObject(
                    UploadObjectArgs.builder()
                            .bucket("testbucket")
                            .object("hello.txt")
                            .filename("D:\\hello.txt")
                            .build());
            //上传hello.txt,上传到txt子目录
            minioClient.uploadObject(
                    UploadObjectArgs.builder()
                            .bucket("testbucket")
                            .object("txt/hello2.txt")
                            .filename("D:\\hello2.txt")
                            .build());
            System.out.println("上传成功");
        } catch (MinioException e) {
            System.out.println("Error occurred: " + e);
            System.out.println("HTTP trace: " + e.httpTrace());
        }

    }

    public static void main(String[] args) throws IOException, NoSuchAlgorithmException, InvalidKeyException {
        upload();
    }


}

上面的参数说明:

minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO
5. 结果

运行main方法,查看结果:
minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO
在MinIO的控制台查看:

http://169.254.133.199:9000

minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

2.3.3 测试删除
//连接的MinIO服务器同上文
...
//删除文件
public static void delete(String bucket,String filepath)throws IOException, NoSuchAlgorithmException, InvalidKeyException {
    try {

        minioClient.removeObject(
                RemoveObjectArgs.builder().bucket(bucket).object(filepath).build());
        System.out.println("删除成功");
    } catch (MinioException e) {
        System.out.println("Error occurred: " + e);
        System.out.println("HTTP trace: " + e.httpTrace());
    }

}

public static void main(String[] args)throws IOException, NoSuchAlgorithmException, InvalidKeyException {
//  upload();
    delete("testbucket","hello.txt");
    delete("testbucket","txt/hello2.txt");

}
...

minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

删除成功!

2.3.4 查询文件是否存在

重新上传文件,然后查询文件是否存在,是否存在,下载到本地

minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

//连接MinIO的服务器同上
...
    //下载文件
    public static void getFile(String bucket,String filepath,String outFile)throws IOException, NoSuchAlgorithmException, InvalidKeyException {
        try {


            try (InputStream stream = minioClient.getObject(
                    GetObjectArgs.builder()
                            .bucket(bucket)
                            .object(filepath)
                            .build());
                 FileOutputStream fileOutputStream = new FileOutputStream(new File(outFile));
            ) {

                // Read data from stream
                IOUtils.copy(stream,fileOutputStream);
                System.out.println("下载成功");
            }

        } catch (MinioException e) {
            System.out.println("Error occurred: " + e);
            System.out.println("HTTP trace: " + e.httpTrace());
        }

    }


    public static void main(String[] args)throws IOException, NoSuchAlgorithmException, InvalidKeyException {
        upload();
//  delete("testbucket","hello.txt");
//  delete("testbucket","txt/hello2.txt");
        getFile("testbucket","txt/hello2.txt","D:\\hello3.txt");
    }
    ...

minio管理界面,框架,hadoop,java,大数据,分布式文件系统,MinIO

2.3.5 全部测试代码
public class MinIOTest {

    static MinioClient minioClient =
            MinioClient.builder()
                    //url先择任何一个server
                    .endpoint("http://169.254.133.199:9000")
                    //用户名密码
                    .credentials("minioadmin", "minioadmin")
                    .build();


    //上传文件
    public static void upload() throws IOException, NoSuchAlgorithmException, InvalidKeyException {
        try {
            boolean found =
                    minioClient.bucketExists(BucketExistsArgs.builder()
                            //选择testbucket
                            .bucket("testbucket").build());
            //检查testbucket桶是否创建,没有创建自动创建
            if (!found) {
                minioClient.makeBucket(MakeBucketArgs.builder().bucket("testbucket").build());
            } else {
                System.out.println("Bucket 'testbucket' already exists.");
            }
            //上传hello.txt
            minioClient.uploadObject(
                    UploadObjectArgs.builder()
                            .bucket("testbucket")
                            .object("hello.txt")
                            .filename("D:\\hello.txt")
                            .build());
            //上传hello.txt,上传到txt子目录
            minioClient.uploadObject(
                    UploadObjectArgs.builder()
                            .bucket("testbucket")
                            .object("txt/hello2.txt")
                            .filename("D:\\hello2.txt")
                            .build());
            System.out.println("上传成功");
        } catch (MinioException e) {
            System.out.println("Error occurred: " + e);
            System.out.println("HTTP trace: " + e.httpTrace());
        }

    }



    //删除文件
    public static void delete(String bucket,String filepath)throws IOException, NoSuchAlgorithmException, InvalidKeyException {
        try {

            minioClient.removeObject(
                    RemoveObjectArgs.builder().bucket(bucket).object(filepath).build());
            System.out.println("删除成功");
        } catch (MinioException e) {
            System.out.println("Error occurred: " + e);
            System.out.println("HTTP trace: " + e.httpTrace());
        }

    }

    //下载文件
    public static void getFile(String bucket,String filepath,String outFile)throws IOException, NoSuchAlgorithmException, InvalidKeyException {
        try {


            try (InputStream stream = minioClient.getObject(
                    GetObjectArgs.builder()
                            .bucket(bucket)
                            .object(filepath)
                            .build());
                 FileOutputStream fileOutputStream = new FileOutputStream(new File(outFile));
            ) {

                // Read data from stream
                IOUtils.copy(stream,fileOutputStream);
                System.out.println("下载成功");
            }

        } catch (MinioException e) {
            System.out.println("Error occurred: " + e);
            System.out.println("HTTP trace: " + e.httpTrace());
        }

    }


    public static void main(String[] args)throws IOException, NoSuchAlgorithmException, InvalidKeyException {
        upload();
//  delete("testbucket","hello.txt");
//  delete("testbucket","txt/hello2.txt");
        getFile("testbucket","txt/hello2.txt","D:\\hello3.txt");
    }
}

2.4 MinIO整合SpringCloud项目

文件上传是众多项目中比较基础的功能,但是其实现起来细节也很多,下面我将通过MinIO实现文件上传。

前置条件;已经导入好了项目,并且搭建好了nacos环境

2.4.1 文件上传controller

SpringWeb提供了注解:@RequestPart,同时指明文件类型consumes = {MediaType.MULTIPART_FORM_DATA_VALUE}

/**
 * 上传文件
 * @param filedata
 * @param folder
 * @param objectName
 * @return
 */
@RequestMapping(value = "/upload/coursefile", consumes = {MediaType.MULTIPART_FORM_DATA_VALUE})
public UploadFileResultDto upload(@RequestPart("filedata")MultipartFile filedata,
                                  @RequestParam(value="folder", required = false) String folder,
                                  @RequestParam(value="objectName", required = false) String objectName){
    Long companyId = 1232141425L;
    //构建参数传给service
    UploadFileParamsDto uploadFileParamsDto = new UploadFileParamsDto();
    //判断文件类型
    String contentType = filedata.getContentType();
    uploadFileParamsDto.setContentType(contentType);
    uploadFileParamsDto.setFileSize(filedata.getSize());
    //contentType中的image/gif、image/jpeg、image/png都包含image
    if(contentType.indexOf("image") >= 0){
        //图片
        uploadFileParamsDto.setFileType("001001");
    }else{
        uploadFileParamsDto.setFileType("001003");
    }
    //文件名称
    uploadFileParamsDto.setFilename(filedata.getOriginalFilename());
    //构建返回对象
    UploadFileResultDto uploadFileResultDto = null;
    try{
        uploadFileResultDto = mediaFileService.uploadFile(companyId, uploadFileParamsDto, filedata.getBytes(), folder,objectName);
    } catch (Exception e) {
        XcPlusException.cast("上传文件过程出错");
    }
    return uploadFileResultDto;
}
2.4.2 文件上传interface、service、minioConfig

①interface

UploadFileResultDto uploadFile(Long companyId, UploadFileParamsDto uploadFileParamsDto, byte[] bytes, String folder, String objectName);

②service

/**
 * 上传文件通用接口
 *
 * @param companyId
 * @param uploadFileParamsDto
 * @param bytes
 * @param folder
 * @param objectName
 * @return
 */
@Override
public UploadFileResultDto uploadFile(Long companyId, UploadFileParamsDto uploadFileParamsDto, byte[] bytes, String folder, String objectName) {
    //获取文件md5值【根据md5可以判断是否是同一文件】
    String fileMd5 = DigestUtils.md5Hex(bytes);
    if (StringUtils.isEmpty(folder)) {
        //如果没有传文件夹,自动按照年月日生成
        folder = getFileFolder(new Date(), true, true, true);
    } else if (folder.indexOf("/") < 0) {
        folder = folder + "/";
    }
    //文件名称
    String filename = uploadFileParamsDto.getFilename();
    if (StringUtils.isEmpty(objectName)) {
        //如果objectName为空,则使用文件的md5值为文件名
        objectName = fileMd5 + filename.substring(filename.lastIndexOf("."));
    }
    //上传到MinIO【文件夹路径+文件名】
    objectName = folder + objectName;
    try {
        //将文件的字节数组转换为字节输入流
        ByteArrayInputStream byteArrayInputStream = new ByteArrayInputStream(bytes);
        String contentType = uploadFileParamsDto.getContentType();
        PutObjectArgs putObjectArgs = PutObjectArgs.builder()
                .bucket(bucket_files)
                .object(objectName)
                //InputStream stream, long objectSize 对象大小, long partSize 分片大小(-1表示5M,最大不要超过5T,最多10000)
                .stream(byteArrayInputStream, byteArrayInputStream.available(), -1)
                .contentType(contentType)
                .build();
        //上传到minio
        minioClient.putObject(putObjectArgs);

        //保存到数据库[存储文件使用的是md5值]
        MediaFiles mediaFiles = mediaFilesMapper.selectById(fileMd5);
        if(mediaFiles == null){
            mediaFiles = new MediaFiles();
            //封装数据
            BeanUtils.copyProperties(uploadFileParamsDto, mediaFiles);
            mediaFiles.setId(fileMd5);
            mediaFiles.setFileId(fileMd5);
            mediaFiles.setCompanyId(companyId);
            mediaFiles.setFilename(filename);
            mediaFiles.setBucket(bucket_files);
            mediaFiles.setFilePath(objectName);
            mediaFiles.setUrl("/" + bucket_files + "/" + objectName);
            mediaFiles.setCreateDate(LocalDateTime.now());
            mediaFiles.setStatus("1");
            mediaFiles.setAuditStatus("002003");
            //插入数据库【文件表】
            mediaFilesMapper.insert(mediaFiles);
        }
        //准备返回数据
        UploadFileResultDto uploadFileResultDto = new UploadFileResultDto();
        BeanUtils.copyProperties(mediaFiles, mediaFiles);
        return uploadFileResultDto;
    }catch (Exception e) {
        log.debug("上传文件失败:{}",e.getMessage());
    }
    return null;
}

//根据日期生成文件夹
private String getFileFolder(Date date, boolean year, boolean month, boolean day) {
    SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd");
    //获取当前日期字符串
    String dataStr = sdf.format(new Date());
    //取出年月日
    String[] arr = dataStr.split("-");
    StringBuffer folderStr = new StringBuffer();
    if (year) {
        folderStr.append(arr[0]);
        folderStr.append("/");
    }
    if (month) {
        folderStr.append(arr[1]);
        folderStr.append("/");
    }
    if (day) {
        folderStr.append(arr[2]);
        folderStr.append("/");
    }
    return folderStr.toString();
}

③minio配置类(从nacos读取配置)文章来源地址https://www.toymoban.com/news/detail-526608.html

/**
 * @author zhouYi
 * @description Minio配置类,配置Minio客户端
 * @date 2023/2/15 10:18
 */
@Configuration
public class MinioConfig {

    //从nacos读取参数

    //URL
    @Value("${minio.endpoint}")
    private String endpoint;
    //账号
    @Value("${minio.accessKey}")
    private String accessKey;
    //密码
    @Value("${secretKey}")
    private String secretKey;

    public MinioClient minioClient(){
        MinioClient minioClient =
                MinioClient.builder()
                        .endpoint(endpoint)
                        .credentials(accessKey, secretKey)
                        .build();
        return minioClient;
    }
}

到了这里,关于分布式文件系统使用——MinIO的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 分布式文件系统HDFS

    分布式文件系统 把文件分布存储到多个计算机节点 上,通过网络实现文件在多台主机上进行分布式存储的文件系统。 分布式文件系统有两大模式: Remote Access Model: 非本地文件不会复制到本地,所以对非本地文件的读取和修改,利用RPC进行。 Upload/ Download Model:所有非本地文

    2024年02月09日
    浏览(31)
  • 分布式文件存储系统-FastDFS

            前言:FastDFS 是一个分布式文件存储系统, 主要用于存储和管理 大规模 的 文件数据,如图片、视频、文档等 ,是淘宝前架构师为了存储图片用C语言开发出来的系统。         服务端有两个组件  Tracker Server 与 Storage Server ,对应两个角色: Tracker: 管理和调度集群

    2024年02月13日
    浏览(50)
  • Hadoop分布式文件系统(三)

    目录 一、Hadoop 1、MapReduce 1.1、理解MapReduce思想 1.2、分布式计算概念 1.3、MapReduce介绍 1.4、MapReduce特点 1.5、MapReduce局限性 1.6、MapReduce实例进程 1.7、MapReduce阶段组成 1.8、MapReduce数据类型 1.9、MapReduce官方示例 1.9.1、示例说明--圆周率PI评估 1.9.2、官方示例--WordCount单词统计 1.10、

    2024年01月16日
    浏览(29)
  • 2. 分布式文件系统 HDFS

    问题一:如果一个文件中有 10 个数值,一行一个,并且都可以用 int 来度量。现在求 10 个数值的和 思路: 逐行读取文件的内容 把读取到的内容转换成 int 类型 把转换后的数据进行相加 输出最后的一个累加和 问题二:10000 个文件,每个文件 2T,文件里的内容依然是每行一个

    2024年02月08日
    浏览(36)
  • GlusterFS(GFS)分布式文件系统

    目录 一、文件系统简介 1、文件系统的组成 2、文件系统的作用 3、文件系统的挂载使用 二、GlusterFS概述 1、GlusterFS是什么? 2、GlusterFS的特点 3、GlusterFS术语介绍 3.1 Brick(存储块) 3.2 Volume(逻辑卷) 3.3 FUSE 3.4 VFS(虚拟端口) 3.5 Glusterd(后台管理进程) 4、GlusterFs采用架

    2023年04月09日
    浏览(27)
  • Hadoop HDFS(分布式文件系统)

    一、Hadoop HDFS(分布式文件系统) 为什么要分布式存储数据 假设一个文件有100tb,我们就把文件划分为多个部分,放入到多个服务器 靠数量取胜,多台服务器组合,才能Hold住 数据量太大,单机存储能力有上限,需要靠数量来解决问题 数量的提升带来的是网络传输,磁盘读写,

    2024年02月06日
    浏览(32)
  • 大数据——HDFS(分布式文件系统)

    Hadoop的两大核心组件 HDFS ( Hadoop Distributed Filesystem ):是一个易于扩展的 分布式文件系统 ,运行在 成百上千 台 低成本 的 机器 上。 HDFS 具有 高度容错能力 ,旨在部署在低成本机器上。 HDFS 主要用于对 海量文件信息 进行 存储 和 管理 ,也就是解决大数据文件(如 TB 乃至

    2023年04月17日
    浏览(33)
  • Hadoop分布式文件系统-HDFS

    HDFS (Hadoop Distributed File System)是 Hadoop 下的分布式文件系统,具有高容错、高吞吐量等特性,可以部署在低成本的硬件上。 HDFS 遵循主/从架构,由单个 NameNode(NN) 和多个 DataNode(DN) 组成: - NameNode : 负责执行有关 ` 文件系统命名空间 ` 的操作,例如打开,关闭、

    2024年02月07日
    浏览(34)
  • minio 分布式文件系统主从复制

    1. 在slave节点下载mc客户端工具 下载 2. 移动或复制mc文件到/usr/local/bin/文件夹 3. 赋值权限给 mc 文件 4. 查看mc客户端版本,看是否可用 5. 在slave服务器上配置minio_slave和minio_master,用于添加对master上minio的访问权限。 6. 查看当前节点服务 7. 复制主节点数据到子节点

    2024年02月13日
    浏览(26)
  • 头歌 分布式文件系统HDFS 答案

    第1关:HDFS的基本操作 在右侧命令行中启动 Hadoop ,进行如下操作。 在 HDFS 中创建 /usr/output/ 文件夹; 在本地创建 hello.txt 文件并添加内容:“ HDFS的块比磁盘的块大,其目的是为了最小化寻址开销。 ”; 将 hello.txt 上传至 HDFS 的 /usr/output/ 目录下; 删除 HDFS 的 /user/hadoop 目录

    2023年04月27日
    浏览(26)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包