hadoop本地化windows部署

1年前作者：陈舟的舟分类：Toy博客阅读(11)违法举报

这篇具有很好参考价值的文章主要介绍了hadoop本地化windows部署。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

前言

需求背景是java代码提交服务器测试周期流程太慢，需要一种能直接在windows本地部署的相关组件。分析项目现有大数据技术栈，包括hadoop、hive和spark(sparksql)，存储和计算都依赖windows系统。期中hive保存在本地的hadoop上，spark提交在hadoop的yarn上。

· hadoop on windows
· hive on windows
· spark on windows(提交方式是spark on yarn)

注意事项：
在spark官网选择spark版本的时候确定对应支持的hadoop版本，然后选择对应hadoop的winutils-master的版本。
Spark下载路径：https://spark.apache.org/downloads.html
Hadoop下载路径：https://archive.apache.org/dist/hadoop/common/
Scala下载路径：https://www.scala-lang.org/download/all.html
Winutils-master下载路径：https://github.com/cdarlint/winutils

1. hadoop on windows

1.1 安装jdk

jdk安装省略了
Win+R输入cmd，再键入java -version，确认jdk安装是否成功
hadoop windows部署,大数据,hadoop,windows,大数据

1.2 安装hadoop

1.2.1 解压

解压下载的包到一个无中文无空格的路径下

1.2.2 备用目录

新建一个无中文无空格的文件夹，作为hadoop的namenode地址和datanode地址

1.2.3 修改配置

分别修改解压包下~\etc\hadoop的相关配置文件

hdfs-site.xml
yan-site.xml
mapred-site.xml
core-site.xml
hadoop-env.cmd

1.2.4 安装winutils-master

解压winutils-master包，找到对应hadoop依赖版本的并进入bin目录将这个文件夹里面的文件整体复制到hadoop的安装路径~/bin下

1.2.5 格式化namenode

以管理员启动cmd.exe，键入hdfs namenode -formet，再确认Y

1.2.6 启动hadoop

以管理员启动cmd.exe，进入到hadoop加压路径~/sbin，执行start-all，当再弹出四个窗口并无报错的时候即启动成功

namenode
datanode
nodemanager
resourcemanager

1.2.7 web-ui登陆hadoop hdfs

我安装的是3.0版本的hadoop，所以登陆页面是https://localhost:9870，如果是2.0版本的hadoop，登陆页面是https://localhost:50070
hadoop windows部署,大数据,hadoop,windows,大数据

2. spark on windows

2.1 安装scala

spark是scala语言开发的，依赖语言环境。类似于安装jdk，Win+R输入cmd，再键入scala -version，确认scala安装是否成功
hadoop windows部署,大数据,hadoop,windows,大数据

2.2 安装spark

2.2.1 解压

解压spark安装包到一个无中文无空格的路径下

2.2.2 环境变量

配置spark环境变量，类似于配置jdk变量。需要配置SPARK_HOME和Path
SPARK_HOME=spark解压安装路径
Path新增一个%SPARK_HOME%\bin

2.2.3 spark配置

修改spark-env.sh添加以下配置，这一步修改的意义是为了让spark的提交走hadoop的yarn
YARN_CONF_DIR=hadoop安装路径/etc/hadoop

2.3 启动spark-shell

执行spark-shell启动
hadoop windows部署,大数据,hadoop,windows,大数据

2.4 登陆web-ui

管理页面，https://localhost:4040
hadoop windows部署,大数据,hadoop,windows,大数据

3. hive on windows

hive on windows 需要安装本地化mysql 忒麻烦了。但是hive on windows 其实很好实现，这里就偷个懒省略了。文章来源地址https://www.toymoban.com/news/detail-605182.html

到了这里，关于hadoop本地化windows部署的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

【新手教程】Windows本地化安装、运行，部署Auto-GPT
OpenAI Key，请登录官网获取 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 2.1安装python(3.8以上版本) a、下载Python安装包在 Download Python | 官网选择Python版本并下载，本教程用的 Python3.10 安装python b、验证是否安装成功？按快捷键win+R，打开运行面板，输入\\\"cmd\\\",然后点击\\\"确定\\\" 进入wind
2024年02月09日
浏览(7)
Excalidraw本地化部署
1 - Excalidraw介绍 Excalidraw是一个开源、小巧易用的手写风格的框图画板软件。 excalidraw官网地址：https://excalidraw.com/ 2 - Excalidraw本地化安装（git方式） 2-1安装部署在terminal中，输入：安装完成后，在terminal中，进入项目文件 2-2 安装依赖环境 - nodeJS NodeJS下载地址： nodejs下载
2024年02月14日
浏览(24)
Remix 完全本地化部署
1.简介 Remix 是我们开发 Solidity 智能合约的常用工具，有时候我们会直接访问在线版的 Remix-IDE。 https://remix.ethereum.org/ 但是，如何将在线Remix链接本地文件系统呢，下面则是部署步骤 2、部署 Remixd Remixd 的安装使用步骤如下：安装 Remixd： npm install -g @remix-project/remixd 启动 Rem
2024年02月17日
浏览(11)
本地化部署stable diffusion
本文是根据https://zhuanlan.zhihu.com/p/606825889 和 https://blog.csdn.net/cycyc123/article/details/129165844两个教程进行的部署测试，终端是windows 前期需要安装python与git环境，这里不赘叙了，首先是几个下载包，可以提前下载： stable diffusion的web界面环境 https://pan.xunlei.com/s/VNQ4LqoKBidPdqSj2xMioVhs
2023年04月09日
浏览(14)
本地化部署大语言模型 ChatGLM
ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。 ChatGLM-6B 使用了和 ChatGPT 相似的技术，针对中文问答和对话进行了优
2023年04月20日
浏览(10)
实战whisper：本地化部署通用语音识别模型
Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。这里呢，我将给出我的一些代码，来帮助你尽快实现【语音转文字】的服务部署。以下是该A
2024年01月18日
浏览(10)
【AI工具】-Stable Diffusion本地化部署教程
今天我们要介绍的是时下最流行的AI绘图软件Stable Diffusion，虽然Diffusion.ai已经开放api，但是长时间的商业化调用我们需要购买很多的金币。所以我们需要找一个平替的AI绘图平台，现在主流市场中AI绘图软件主要就是OpenAI的DALLE、midjourney以及今天要学习的Stable Diffusion，而前两
2024年02月13日
浏览(9)
使用nextjs本地化部署AI大模型gemma
博主是AI新手，如有不对还请评论区指教～这里介绍mac的部署方式，win也可以实现。本案例使用到：ollama + nextjs + langchain.js + milvus 来实现知识库问答和聊天。 ollama：本地运行模型服务 nextjs：前端框架项目 langchain.js：调用模型服务并对话 milvus：向量数据库开源代码：G
2024年04月13日
浏览(12)
部署本地化stable-diffusion遇到问题，求解
(stable-diffusion-webui) C:Usersqinchstable-diffusion-webuiwebui-user.bat venv \\\"C:Usersqstable-diffusion-webuivenvScriptsPython.exe\\\" Python 3.10.6 | packaged by conda-forge | (main, Oct 24 2022, 16:02:16) [MSC v.1916 64 bit (AMD64)] Commit hash: 076d624a297532d6e4abebe5807fd7c7504d7a73 Traceback (most recent call last): File \\\"C:Usersqstable-diffu
2024年02月03日
浏览(13)
FastChat 本地化安装部署-拥有属于私人的ChatGPT
写在前面：第一发稿把自己熬夜几天的一些经历写下来，希望能给AI爱好者一个前车之鉴，自从看到斯坦福-ALPACA项目就想着能否能否本地化部署一套AI CHAT，所以找了很多网站，都没有FastChat部署能很完整的写下来，所以有了本文： 1 前期准备： N卡（24G以上显存），16G内存
2024年02月02日
浏览(8)