Apache Paimon 使用之文件系统配置

这篇具有很好参考价值的文章主要介绍了Apache Paimon 使用之文件系统配置。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1)概述

Paimon 和 Flink 一样使用了插件式的 file systems,如果使用Flink引擎,用户可以根据 plugin 机制配置 plugin 结构。

然而,对于 Spark 引擎 和 Hive 引擎,它们提供的 Jars 可能与 Flink 提供的产生冲突,不能直接使用,因此 Paimon 自己也提供了FileSystem插件,供用户从Spark或Hive端查询表。

支持的文件系统

FileSystem URI Scheme Pluggable Description
Local File System file:// N 内置支持
HDFS hdfs:// N 内置支持, 确保集群处于 hadoop environment
Aliyun OSS oss:// Y
S3 s3:// Y
2)HDFS
1.HDFS 配置

对于 Flink/Java API:需要配置 Hadoop 环境。

设置环境变量HADOOP_HOME或HADOOP_CONF_DIR。
在paimon catalog中配置'hadoop-conf-dir'
通过paimon catalog中的前缀'hadoop.'配置Hadoop选项。

对于 Spark/Hive:HDFS配置可直接通过集群获得。

2.Hadoop-compatible file systems (HCFS)

当Hadoop libraries在类路径上时,所有Hadoop文件系统都会自动可用。

通过这种方式,Paimon无缝支持所有实现org.apache.hadoop.fs.FileSystem接口的Hadoop文件系统,以及所有与Hadoop兼容的文件系统(HCFS)。

  • HDFS
  • Alluxio(见下面的配置细节)
  • XtreemFS

Hadoop配置必须在core-site.xml文件中有一个用于所需文件系统实现的配置。

对于Alluxio支持,请在core-site.xml文件中添加以下配置:文章来源地址https://www.toymoban.com/news/detail-838828.html

<property>
  <name>fs.alluxio.impl</name>
  <value>alluxio.hadoop.FileSystem</value>
</property>

到了这里,关于Apache Paimon 使用之文件系统配置的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 流数据湖平台Apache Paimon(二)集成 Flink 引擎

    Paimon目前支持Flink 1.17, 1.16, 1.15 和 1.14。本课程使用Flink 1.17.0。 环境准备 2.1.1 安装 Flink 1)上传并解压Flink安装包 tar -zxvf flink-1.17.0-bin-scala_2.12.tgz -C /opt/module/ 2)配置环境变量 2.1.2 上传 jar 包 1)下载并上传Paimon的jar包 jar包下载地址:https://repository.apache.org/snapshots/org/apache/pa

    2024年02月09日
    浏览(46)
  • 新一代数据湖存储技术Apache Paimon入门Demo

    目录 前言 1. 什么是 Apache Paimon 一、本地环境快速上手 1、本地Flink伪集群 2、IDEA中跑Paimon Demo 2.1 代码 2.2 IDEA中成功运行 3、IDEA中Stream读写 3.1 流写 3.2 流读(toChangeLogStream) 二、进阶:本地(IDEA)多流拼接测试 要解决的问题: note: 1、\\\'changelog-producer\\\' = \\\'full-compaction\\\' (1)m

    2024年02月08日
    浏览(51)
  • 基于apache的http文件服务配置

    背景: 公司的产品使用的第三方模组可以OTA,厂家提供的是window开启软件,这样就可以在本机做http下载服务器,然后使用端口映射的方式,公开到外网,这样就可以进行4G网络访问内网服务器了。但这个有个弊端,需要电脑一直开着才有文件下载服务,端口也不是固定的,临

    2024年01月22日
    浏览(44)
  • 服务器的Apache配置文件在哪儿?

    诸神缄默不语-个人CSDN博文目录 以下回复来自GPT-4网页端: Apache的配置文件的位置可能会因操作系统和Apache版本的不同而不同。以下是一些常见的位置: 在Ubuntu和其他Debian-based系统中,主配置文件通常位于 /etc/apache2/apache2.conf ,而站点特定的配置文件通常位于 /etc/apache2/sit

    2024年02月13日
    浏览(48)
  • Apache Maven简介&安装及系统坏境配置&eclipse配置Apache Maven---详细介绍

         Maven可以简化项目的构建和依赖管理,并提供了一种规范化和可复用的方式来管理Java项目。它广泛应用于Java开发领域,简单来说:它 提供了一个简单而强大的方式来管理项目的构建、依赖关系和文档 在企业级项目中被广泛采用。 构建管理:Maven使用一个中央的配置文

    2024年02月13日
    浏览(42)
  • Linux系统服务:Apache安装及配置应用

    目录 一、Apache安装 1、Apache简介 2、Yum安装 3、编译安装 4、服务管理 5、编译安装实现systemctl服务管理 二、Apache配置应用 1、基础应用 2、隐藏版本号  3、更改监听端口 4、httpd服务3种工作模式 5、httpd服务处理过程  1、Apache简介   Apache即阿帕奇是一款开源的、世界使用排名

    2024年02月04日
    浏览(38)
  • apache2配置文件 Require all granted是什么意思

    修改apache2的配置文件 /etc/apache2/apache2.conf,需要增加网站代码的路径,下列配置是什么意思呢 Options - 如果设置了这个选项,表示禁用了指定的功能,这里的 \\\"Indexes\\\" 表示禁用目录列表功能,即当用户访问一个目录时,不会显示该目录下的文件列表。 FollowSymLinks - 如果设置了这

    2024年02月11日
    浏览(45)
  • 第一章 Linux系统服务:Apache安装及配置应用

    1.1http与html 1.2浏览器访问网站的过程 1.3HTTP工作机制 1.4版本 1.5HTTP方法 1.6.http状态码 1.7请求报文 1.8 响应报文 1.Apache基础知识 2.Apache配置文件位置 1.LAMP平台概述 2.LAMP各组件主要作用 3.构建LAMP平台顺序 1. prefork模式(默认模式) 2. worker模式 3. event模式 1.1http与html HTTP:为解决

    2024年02月02日
    浏览(45)
  • 【apache-maven-3.5.4\conf\setting文件配置】

    apache-maven-3.5.4confsetting文件配置(老版本配置) apache-maven-3.5.4confsetting文件配置(改良后的版本)

    2024年02月15日
    浏览(39)
  • 使用 Apache POI XDGF 读取 vsdx 文件

    引入依赖 下载示例文件:A flowchart diagram that details the steps for buying a property Java代码如下: 输出结果如下 参考资料: 1. Apache POI - HDGF and XDGF - Java API To Access Microsoft Visio Format Files 2.Introduction to the Visio file format (.vsdx) 3.java导入visio文件_xdgfvisiorenderer-CSDN博客 4.Featured Visio template

    2024年01月16日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包