HNU-数据挖掘-实验1-实验平台及环境安装

这篇具有很好参考价值的文章主要介绍了HNU-数据挖掘-实验1-实验平台及环境安装。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

数据挖掘课程实验实验1 实验平台及环境安装

计科210X 甘晴void 202108010XXX
HNU-数据挖掘-实验1-实验平台及环境安装,# 【专选】数据挖掘,数据挖掘,人工智能

实验背景

Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。Python 是 FLOSS(自由/开放源码软件)之一。Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构。Python的最大的优势之一是丰富的库,跨平台的,在UNIX,Windows和Macintosh兼容很好。

实验目标

在Linux平台下安装、配置python环境和相关软件。

实验步骤

1.安装虚拟机和Linux平台,熟悉Ubuntu环境。

(1)虚拟机使用Oracle VM VirtualBox。之前计算机系统和操作系统课程也使用的该平台。

HNU-数据挖掘-实验1-实验平台及环境安装,# 【专选】数据挖掘,数据挖掘,人工智能

(2)创建Linux操作系统64=位。使用xubuntu20.04版本。

HNU-数据挖掘-实验1-实验平台及环境安装,# 【专选】数据挖掘,数据挖掘,人工智能

(3)安装完系统之后立加装扩展功能。

2.在Linux平台上搭建Python平台,并安装Python环境工具anaconda。

Linux自带python平台,在终端输入

python3

查看本地python环境,得知是python3.8环境。

首先了解anaconda与miniconda的区别。

Anaconda是一个包含了conda、Python和超过150个科学包及其依赖项的科学Python发行版。它具有可视化图形用户界面(Anaconda Navigator)并且为了方便新手使用,预先包含了大量的库,如NumPy, Pandas, Scipy, Matplotlib等。

相较之下,Miniconda更加轻量级。它只包含了Python和Conda,但并没有预装其他的库。Miniconda用户需要手动安装他们需要的包,这使得Miniconda的环境更为简洁,可以根据实际需求来安装必要的包,避免不必要的存储占用。

考虑到作为虚拟机的Linux系统实际上有的存储空间并不大,所以打算安装miniconda替代anaconda。

(1)访问miniconda的官网https://docs.conda.io/projects/miniconda/en/latest/获取信息

(2)在Linux下使用如下指令进行安装并初始化。

mkdir -p ~/miniconda3
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O ~/miniconda3/miniconda.sh
bash ~/miniconda3/miniconda.sh -b -u -p ~/miniconda3
rm -rf ~/miniconda3/miniconda.sh
~/miniconda3/bin/conda init bash
~/miniconda3/bin/conda init zsh

步骤截图如下

HNU-数据挖掘-实验1-实验平台及环境安装,# 【专选】数据挖掘,数据挖掘,人工智能

3.掌握Anaconda下的Python环境安装,创建名称为emoji的python3.7环境。

安装了最新版本的miniconda之后,再次打开终端,会显示一个默认的(base)在前面,形如以下。

(base) wolf@wolf-VirtualBox:~/桌面$ 

表示miniconda基本安装时 成功的,目前处于conda的环境下。

此时再次查看python3的版本,发现不知什么时候升级成3.11了。通过查阅资料发现,miniconda会自动为我们配置python环境,不需要手动再下载python版本。

使用以下指令配置环境。

conda create -n emoji python=3.7

安装完成后使用如下指令查看

conda info -e

发现出现了原来的基础环境(base)和新建的环境(emoji)

HNU-数据挖掘-实验1-实验平台及环境安装,# 【专选】数据挖掘,数据挖掘,人工智能

此时若使用

conda activate emoji //进入
conda deactivate  //退出
conda config --set auto_activate_base true
conda config --set auto_activate_base false  	//取消自动进入

★这里还应该加一步换源(换用清华源)

pip install pip -U
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

4.熟练安装pycharm和jupyter notebook。

使用Linux访问pycharm官方网址

https://www.jetbrains.com/pycharm/download/?section=linux

下载Linux下的pycharm,注意不要下载成Professional版本,要下载community版本的。

安装完毕后找到位置,解压该压缩包。

tar -zxvf pycharm-community-2023.2.3.tar.gz

进入bin文件夹

./pycharm.sh

即可进行安装,安装后就可以打开pycharm,可以看见与windows下是一致的。

HNU-数据挖掘-实验1-实验平台及环境安装,# 【专选】数据挖掘,数据挖掘,人工智能

接下来为pycharm配置conda的环境。即pycharm作为编辑器,打开conda环境下的python工程。选择conda环境和对应版本即可。

HNU-数据挖掘-实验1-实验平台及环境安装,# 【专选】数据挖掘,数据挖掘,人工智能

这里我们发现很不方便,每次打开pycharm都需要到里面去打开,故可以创建桌面的快捷方式。

关于jupyter-notebook,这个在我的windows系统下的anaconda环境中是已经存在的,我认为再安装jupyter的意义不是很大,故没有在这里安装。需要用到的时候我会去再进行安装的。

HNU-数据挖掘-实验1-实验平台及环境安装,# 【专选】数据挖掘,数据挖掘,人工智能

5.掌握pip和conda命令安装常用软件包。比如numpy、pandas、tensorflow、 h5py、mygene matplotlib、seaborn、umap-learn等。

这一步就比较基础了,在之前windows下的anaconda环境中,我们也做过类似的事情。接下来逐个安装即可。

进入emoji环境。

conda activate emoji
conda install numpy
conda install pandas
pip install tensorflow #使用conda安装失败
conda install h5py
conda install matplotlib
conda install seaborn
pip install umap-learn #使用conda安装失败
conda list

出现以下三个done这样就表示这个包安装成功了。

HNU-数据挖掘-实验1-实验平台及环境安装,# 【专选】数据挖掘,数据挖掘,人工智能

其中tensorflow没有成功安装,故使用pip进行安装。

HNU-数据挖掘-实验1-实验平台及环境安装,# 【专选】数据挖掘,数据挖掘,人工智能

其他都成功安装。

安装完毕之后使用

df -TH 
conda list

分别查看Linux文件系统剩余空间和conda列表

HNU-数据挖掘-实验1-实验平台及环境安装,# 【专选】数据挖掘,数据挖掘,人工智能

可以看到我20G的空间啊!!!都被装满了。文章来源地址https://www.toymoban.com/news/detail-814480.html

到了这里,关于HNU-数据挖掘-实验1-实验平台及环境安装的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • HNU-数据挖掘-作业1

    计科210X 甘晴void 202108010XXX 假设所分析的数据包括属性 age,它在数据元组中的值(以递增序)为13 ,15 ,16 ,16 ,19 ,20 ,20 ,21 ,22 ,22 ,25 ,25 ,25 ,25 ,30 ,33 ,33 ,35 ,35 ,35 ,35 ,36 ,40 ,45 ,46 ,52,70。 a. 该数据的均值是多少?中位数是什么? b. 该数据的众数是什么?讨论数据的模态(即二模、三模

    2024年01月22日
    浏览(43)
  • 《数据挖掘基础》实验:Weka平台实现分类算法

    进一步理解分类算法(决策树、贝叶斯),利用weka实现数据集的分类处理,学会调整模型参数,以图或树的形式给出挖掘结果,并解释规则的含义。 随机选取数据集(UCI或data文件夹),完成以下内容:(用三种方法:KNN、C4.5算法、贝叶斯算法) 文件导入与编辑 参数设置说

    2024年02月05日
    浏览(49)
  • 数据挖掘 实验一、数据预处理

    一、 实验目的: (1) 熟悉 VC++编程工具和完全数据立方体构建、联机分析处理算法。 (2) 浏览拟被处理的的数据,发现各维属性可能的噪声、缺失值、不一致性等,针对存在的问题拟出采用的数据清理、数据变换、数据集成的具体算法。 (3) 用VC++编程工具编写程序,实

    2024年02月08日
    浏览(41)
  • 数据挖掘实验(Apriori,fpgrowth)

    Apriori:这里做了个小优化,比如 abcde 和 adcef 自连接出的新项集 abcdef ,可以用 abcde 的位置和 f 的位置取交集,这样第 n 项集的计算可以用 n-1 项集的信息和数字本身的位置信息计算出来,只需要保存第 n-1 项集的位置信息就可以提速 Fpgrowth的算法,我没有递归建树,只建了一

    2024年04月23日
    浏览(34)
  • 数据挖掘实验——Apriori算法实现

    关联规则分析是数据挖掘中最活跃的研究方法之一,目的是在一个数据集中找出各项之间的关联关系,而这种关系并没有在数据中直接表示出来。本实验主要目的是培养学生能够运用Apriori算法数据挖掘方法进行数据挖掘。 学习掌握数据挖掘方法中的Apriori算法。 就餐饮企业而

    2024年02月06日
    浏览(56)
  • 【手写数字识别】数据挖掘实验二

    用PyTorch实现MNIST手写数字识别(最新,非常详细) 图像识别 (Image Recognition)是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。 图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。机器学习领域一般将此类

    2024年02月07日
    浏览(35)
  • 数据挖掘 | 实验一 数据的清洗与预处理

    1)了解数据质量问题、掌握常用解决方法; 2)熟练掌握数据预处理方法,并使用Python语言实现; PC机 + Python3.7环境(pycharm、anaconda或其它都可以) 清洗与预处理的必要性 在实际数据挖掘过程中,我们拿到的初始数据,往往存在缺失值、重复值、异常值或者错误值,通常这

    2023年04月08日
    浏览(39)
  • 信息检索与数据挖掘 | 【实验】排名检索模型

    在Experiment1的基础上实现最基本的Ranked retrieval model Input :a query (like Ron Weasley birthday) Output : Return the top K (e.g., K = 100) relevant tweets. Use SMART notation: lnc.ltn Document: logarithmic tf (l as first character), no idf and cosine normalization Query: logarithmic tf (l in leftmost column), idf (t in second column), no norma

    2024年02月08日
    浏览(35)
  • 数据挖掘实验:使用 Hadoop 实现 WordCount 应用

    使用 Hadoop 实现WordCount 应用。 WordCount 是一个最简单的分布式应用实例,主要功能是统计输入目录中所有单词出现的总次数,如文本文件中有如下内容: Hello world 则统计结果应为: Hello 1 world 1 WordCount 可以使用多种方式实现,本次实验内容选择使用 Hadoop 实现 WordCount 程序,并

    2023年04月17日
    浏览(46)
  • 数据挖掘实验-主成分分析与类特征化

    数据集代码 https://www.aliyundrive.com/s/Jtcuion5iNC 1.实验目的 了解主成分分析的目的,内容以及流程。 掌握主成分分析,能够进行编程实现。 2.实验原理 主成分分析的目的 主成分分析就是把原有的多个指标转化成少数几个代表性较好的综合指标,这少数几个指标能够反映原来指标

    2024年02月07日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包