记安装pyspark遇到问题已经解决问题的全过程

这篇具有很好参考价值的文章主要介绍了记安装pyspark遇到问题已经解决问题的全过程。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

我写这篇小博客的由来:
前天我修改我Ubuntu的用户名名称,改成别人的名字缩写,这样就可以方便他截图交作业了。但没想到的是,修改个用户名居然导致我虚拟机不能正常开机。而且还比较麻烦,不像修改主机名一样简单。无奈之下只好重装系统,重头部署大数据环境,我想着之前有安装过所有环境经验,应该一个小时之内可以完成的。一开始安装Hadoop,hive,hbase,spark很顺利。但是到了pyspark时候已经折腾我大半天了。同样的电脑,同样的操作,遇到了我之前没遇到过的问题。我觉得安装大数据感觉是一门玄学。也给我血痛的教训,不要顺便修改用户名,搞不好会死机的。


问题描述

  • python环境3.8.10 spark版本2.4.4 pyspark版本2.4.4

我的linux自带python环境是3.8.10 里面没有自带pip 于是就先下载pip

sudo apt install python3-pip

接着下载pyspark

sudo pip install pyspark

接着启动pyspark
记安装pyspark遇到问题已经解决问题的全过程
好了报错,上网查看错误原因,网上说pyspark2.4.4不支持python3.8以上的环境(巧了我正好是版本pyspark是2.4.4而python是3.8.),只需要降低python版本就可以了。

接着下载安装python3.6,在安装python3.6之前 首先需要先下载两个环境依赖

apt-get install gcc        安装c++解释器

还有个解压包

 sudo  apt-get -y install zlib*

不下载这个解压包到后面make install过程中你会报一个错误
记安装pyspark遇到问题已经解决问题的全过程
zipimport.ZipImportError: can’t decompress data; zlib not available,报错内容意思是:无法解压缩数据;zlib不可用

  • 下载python3.6
wget https://www.python.org/ftp/python/3.6.1/Python-3.6.1.tgz

解压Python文件

tar -zvxf  Python-3.6.1.tgz  

进入Python3.6文件

cd  Python3.6

先创建python3.6文件夹,主要用来把所有编译安装好文件放在这里方便管理。系统自带的python文件都是东放一个西放一个

sudo mkdir /usr/local/python3.6

接着配置文件指定安装到那个目录(要进入python3.6文件夹才能输入下面命令)

./configure --prefix=/usr/local/python3.6

编译(又是一个漫长的编译安装过程)

make  编译

编译成功会出现这样提示

记安装pyspark遇到问题已经解决问题的全过程

安装

sudo make install

记安装pyspark遇到问题已经解决问题的全过程
接着将编译安装好的python3.6解释器放在系统的bin目录(也可以不要用放,但是,你要配置环境变量) 这一步要注意,我当时进入$/usr/local/python3.6/bin 用着相对路径 ln -s python3.6 /usr/bin/python3.6 结果启动失败,所以你一定要用绝对路径 ln -s ./python3.6 /usr/bin/python3.6 或者下面第一条

sudo ln -s  /usr/local/python3.6/bin/python3.6   /usr/bin/python3.6
sudo ln -s /usr/loacl/python3.6/bin/pip3.6     /usr/bin/pip3.6

这里注意python3.6自带pip 而python3.5是没有的。而且其实我一开始安装python3.5过程中编译安装过程不是很顺利,可能是python3.5所需依赖的环境比较多。所有建议安装python3.6
记安装pyspark遇到问题已经解决问题的全过程

输入python3.6 出现下面表示安装成功了。
记安装pyspark遇到问题已经解决问题的全过程

输入python3

  • 在此之前我还用到应该问题 启动python3.6 时候报错
    报错内容:-bash: /usr/lib/command-not-found:/usr/bin/python3:解释器错误: 没有那个文件或目录
    我当时忘记怎么解决了,总之把之前python文件删除注意别把系统自带的python文件删除了。重新装严格按照上面来应该就不会有问题。

  • 这样就有两个python环境 输入python3 (系统自带)就使用python3.8 输入python3.6就使用python3.6解释器 也可以将python3 指向python ln -s /usr/bin/python3 /usr/bin/python 你输入python就使用python3.8解释器

接着修改spark配置文件
记安装pyspark遇到问题已经解决问题的全过程
将pyspark选择的python版本选择python3.6
记安装pyspark遇到问题已经解决问题的全过程
再次启动pyspark
记安装pyspark遇到问题已经解决问题的全过程
好了又报错,以往之前这样就可以成功了,但是这次不行。都说了是一门玄学。报错的内容意思是 你python里面没有安装py4j模块

那怎么办? 那就安装py4j模块咯

> pip3.6 install py4j

这里注意 如果pip3 instal py4j 你就把py4j库安装到python3.8那文件里面的。但是我们需要用python3.6来运行pyspark,所以要把py4j安装到pip3.6

用pip3 下载的库会放到python3.8 pip下载的库就放到python3.6
记安装pyspark遇到问题已经解决问题的全过程

记安装pyspark遇到问题已经解决问题的全过程

回归主题 接下来安装时又报了个错误
记安装pyspark遇到问题已经解决问题的全过程

报错内容如下
pip is configured with locations that require TLS/SSL, however the ssl module in Python is not available.
Collecting py4j
Could not fetch URL https://pypi.python.org/simple/py4j/: There was a problem confirming the ssl certificate: Can’t connect to HTTPS URL because the SSL module is not available. - skipping
Could not find a version that satisfies the requirement py4j (from versions: )
No matching distribution found for py4j
这段报错内容翻译过来简单来说就是 无法下载py4j。原因在于需要ssl/tls证书,但是这两个证书在python3.6是不可用的。
接着我用python3.8 去下载pip3 install py4j 发现可以。但是对我来说没用。


上网寻找办法
都说安装openssl 就可以了 但是出现无法定位包e:openssl-devel 我换了网址镜像修改/etc/apt/sources.list镜像网站还是不行

apt-get install openssl-devel

最后找到办法

pip install py4j -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

pyspark启动成功

记安装pyspark遇到问题已经解决问题的全过程
参考文章
https://blog.csdn.net/weixin_43837883/article/details/89606425
https://blog.csdn.net/SevenBerry/article/details/121088835
https://blog.csdn.net/qq_41842588/article/details/117857189

总之挺坎坷的。写于----2022年10/11 秋 17:45 心情:差(昨天科目三刚挂)

保持饥饿,保持愚蠢 —Steve Jobs文章来源地址https://www.toymoban.com/news/detail-459914.html

到了这里,关于记安装pyspark遇到问题已经解决问题的全过程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • selenium包安装失败,解决全过程

    今晚用到了selenium库,就用命令 自然而然,因为没有安装此库,所以selenium下面有条红色波浪线,遂 来进行安装,结果安装失败。 在Terminal里查看 解决过程: 1.进入官网,对selenium包进行下载 官网下载地址 下载完如下: 进入到python项目的环境里,放在lib的site-packages下 开始

    2024年02月11日
    浏览(30)
  • gitlab上传新项目全过程+常见问题解决

    基本操作 1、首先需要在gitlab上新建一个空项目 2、编辑项目名称 3、在本地电脑上新建一个空的文件夹(或者是一个固定统一的文件夹),方便后续找到,这里会将gitlab的项目拉到这个文件内,点击进入这个文件夹,右键选择git bash here。 4、输入 git clone 地址 ,此地址可以在

    2024年02月09日
    浏览(36)
  • Nginx http 文件服务器 中文名称文件乱码以及不能访问下载问题 (解决全过程)...

    书接上文: 在Windows 环境下使用 Nginx 搭建 HTTP文件服务器 实现文件下载 全步骤(详细) 发现的中文乱码问题,终于自己解决了! ^_^ 问题起因: 首先是发现放在 Nginx 共享文件夹下的中文文件会出现乱码问题 初步解决办法: 检查 conf 下 nginx.conf 配置文件中的 charset 编码问题 发

    2024年02月11日
    浏览(46)
  • 【网络教程】记一次使用Docker手动搭建BT宝塔面板的全过程(包含问题解决如:宝塔面板无法开启防火墙,ssh,nginx等)

    演示的系统环境: Ubuntu 22.04.3 LTS 更新 安装/升级docker到最新版本 升级docker相关命令如下

    2024年02月10日
    浏览(41)
  • 利用阿里云服务器(CentOS7.8 64位)建站时报404 Not Found nginx解决办法以及Nginx(1.20.1)的安装及配置全过程

            这几天在利用阿里云服务器部署自建小网站项目时,发现这个问题:404 Not Found nginx。经过检查后发现是因为Nginx在云服务器上还没安装上。现准备好以后解决办法供有需要的小伙伴们参考。         网站域名及备案的具体步骤我就不再一一说啦,不知道的可以看

    2024年02月04日
    浏览(40)
  • ElasticSearch-安装部署全过程

    本文已收录于专栏 《中间件合集》   是一个开源的分布式搜索和分析引擎,它建立在 Apache Lucene 搜索引擎库之上。它提供了一个分布式、多租户的全文搜索引擎,具有强大的实时搜索和分析能力。Elasticsearch 是用 Java 语言编写的,并且提供了 RESTful API,使其易于集成和使用

    2024年02月12日
    浏览(34)
  • linux安装docker全过程

    3. 第二步:设置docker的存储库。就两条命令,我们直接执行就好。 ​ ​ 4. 安装docker engine和docker-compose。 执行命令: ​ 等到屏幕输出success后,我们输入docker -v 。如果输出了它的版本号那么就证明docker安装好了。输入 docker compose version 如果也输出了版本号,则证明 docker-co

    2024年02月10日
    浏览(35)
  • Windows安装DVWA(全过程)

    安装DVWA环境目的是搭建漏洞靶场环境,安全进行攻防演示 1、PHPStudy软件安装 2、DVWA下载与安装 1、PHPStudy软件安装 【1】访问此网站PHPStudy下载软件(下载最新版的就可以) 【2】在下载好的压缩包中运行.exe文件 【3】设定安装路径(自己设定安装路径,最好不要放在C盘)安装

    2024年01月16日
    浏览(37)
  • Microsoft Office安装全过程记录

    相信过新年时大家都会收到许多压岁钱吧(也可能是输出了许多压岁钱),过了一个新年,我收到了2000多块压岁钱。因此,我想完成一个一直没有完成的梦想,那就是把电脑上的WPS换成信息课老师示范的Microsoft Office(我放弃WPS的两个原因:1. 没Office用着习惯;2. 它慢慢的也

    2024年02月08日
    浏览(43)
  • macOS虚拟机安装全过程(VMware)

    作为一名忠实果粉,我最大的愿望就是能够拥有一台Macbook,体验macOS,但是作为学生党,这价钱,贵到离谱啊~~~   不过,VMware这个神器,可以解决一切问题:既然macOS可以在Macbook上运行,为什么就不能在VMware虚拟机上运行呢?我立马打开VMware,行动了起来~ ---------------------

    2024年02月03日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包