〖数据挖掘〗weka3.8.6的安装与使用

这篇具有很好参考价值的文章主要介绍了〖数据挖掘〗weka3.8.6的安装与使用。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

背景

一、安装

二、使用explorer

1. 介绍

2.打开自带的数据集(Preprocess)

1.打开步骤

2.查看属性和数据编辑

3.classify

4.Cluster

5.Associate

6.Select attributes

7.Visualize

待补充


背景

Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费
的,非商业化软件,与之对应的是SPSS公司商业数据挖掘产品--Clementine ;weka是基于JAVA环境下开源的
机器学习(machine learning)以及数据挖掘(data mining)软件。Weka的主要开发者来自新西兰的怀卡托大学(The University of Waikato)。WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。

一、安装

安装简单,一路next。

1.打开weka3.8.6的安装包

〖数据挖掘〗weka3.8.6的安装与使用

2.点击 next

〖数据挖掘〗weka3.8.6的安装与使用

 3.点击I Agree

〖数据挖掘〗weka3.8.6的安装与使用

4.点击next

〖数据挖掘〗weka3.8.6的安装与使用

5.选择安装路径如:D:\weka-3-8-6

〖数据挖掘〗weka3.8.6的安装与使用

6.点击install

〖数据挖掘〗weka3.8.6的安装与使用

等待后,finish。下面是安装成功后打开的初始界面〖数据挖掘〗weka3.8.6的安装与使用

二、使用explorer

〖数据挖掘〗weka3.8.6的安装与使用

1. 介绍

〖数据挖掘〗weka3.8.6的安装与使用

Preprocess:预处理
Classify:分类
Cluster:聚类
Associate:关联
Select attributes:选择属性
Visualize:可视化

〖数据挖掘〗weka3.8.6的安装与使用

  • open file:从文件中打开一组实例
  • open URL:从URL中打开一组实例
  • open DB:从数据库中打开一组实例
  • generate:生成人工数据
  • undo:撤销对数据集最后更改
  • edit:在查看器中打开当前数据集进行编辑
  • save:将工作关系保存到文件中

 〖数据挖掘〗weka3.8.6的安装与使用

属性

  • ALL:全选
  • None:全不选
  • invert:取反
  • pattern:输入perl正则表达式

〖数据挖掘〗weka3.8.6的安装与使用

该位置展示具体属性都有什么

  • remove:选择属性后,点击删除,可用undo撤回。

〖数据挖掘〗weka3.8.6的安装与使用

当前的关系

  • 关系:投票  属性:17
  • 实例:435   权重和:435

2.打开自带的数据集(Preprocess)

1.打开步骤

选择openfile

〖数据挖掘〗weka3.8.6的安装与使用

选择data文件

 〖数据挖掘〗weka3.8.6的安装与使用

这里我们可以看到一些weka自带的数据集

〖数据挖掘〗weka3.8.6的安装与使用

选择其中一个数据集打开,我选择的是vote.arff

〖数据挖掘〗weka3.8.6的安装与使用

2.查看属性和数据编辑

2.1查看属性

选择属性,可以下拉查看并选择

〖数据挖掘〗weka3.8.6的安装与使用

 〖数据挖掘〗weka3.8.6的安装与使用

Visualize All:查看所有属性直方图

〖数据挖掘〗weka3.8.6的安装与使用

2.2数据编辑

〖数据挖掘〗weka3.8.6的安装与使用

 点击Edit,弹出viewer,在这里面可以查看并编辑数据。

〖数据挖掘〗weka3.8.6的安装与使用

3.classify

分类是指根据事物的某些共同特征,将它们分成若干组或类别,以达到简化、归纳和管理的目的。在机器学习领域中,分类是指根据已有数据集中的特征和标签信息,训练出一个算法模型,用于预测新样本所属的类别。分类问题是机器学习中最常见的问题类型,其应用广泛,如垃圾邮件识别、图像分类、医学诊断等等。机器学习中一些常见的分类算法包括决策树、支持向量机、朴素贝叶斯、神经网络等。

〖数据挖掘〗weka3.8.6的安装与使用

〖数据挖掘〗weka3.8.6的安装与使用

测试选项 

  • Use training set:使用训练集
  • Supplied test set:提供测试集
  • Cross-validation:交叉验证
  • Percentage split:按比例分配
  • start:点击即用

4.Cluster

聚类是指根据一组数据的相似性,将它们分为若干个组或簇,使得同一个簇内的元素彼此相似,不同簇之间的元素差异较大。聚类是无监督学习领域中的重要问题,与分类问题不同,聚类问题中没有预先定义好的标签信息,需要通过算法自动挖掘数据的内在结构和规律。聚类算法可以应用于数据挖掘、图像分割、社交网络分析等领域,是机器学习中的重要研究方向。常见的聚类算法有K-means、层次聚类、DBSCAN、OPTICS等。

〖数据挖掘〗weka3.8.6的安装与使用

集群模式【Cluster mode】

  • Use training set:使用训练集
  • Supplied test set:提供测试集
  • Percentage split:比例分割
  • Classes to clusters evalation:类到聚类的评估

5.Associate

〖数据挖掘〗weka3.8.6的安装与使用

6.Select attributes

〖数据挖掘〗weka3.8.6的安装与使用

属性选择模式

  • Use full training set:使用完整的训练集

  • Cross-validation:交叉验证

7.Visualize

〖数据挖掘〗weka3.8.6的安装与使用

  • update:更新
  • select attribute:选择属性
  • subsample:子样品

软件获取方式:公众号回复:weka文章来源地址https://www.toymoban.com/news/detail-455373.html

到了这里,关于〖数据挖掘〗weka3.8.6的安装与使用的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 《数据挖掘基础》实验:Weka平台实现分类算法

    进一步理解分类算法(决策树、贝叶斯),利用weka实现数据集的分类处理,学会调整模型参数,以图或树的形式给出挖掘结果,并解释规则的含义。 随机选取数据集(UCI或data文件夹),完成以下内容:(用三种方法:KNN、C4.5算法、贝叶斯算法) 文件导入与编辑 参数设置说

    2024年02月05日
    浏览(62)
  • 【数据挖掘大作业】基于决策树的评教指标筛选(weka+数据+报告+操作步骤)

    数据挖掘大作业 下载链接:【数据挖掘大作业】基于决策树的评教指标筛选(weka使用手册+数据+实验报告) 一、考核内容 现有某高校评教数据(pjsj.xls),共计842门课程,属性包括:课程名称、评价人数、总平均分以及10个评价指标Index1-Index10。指标内容详见表1。 表 1 学生评教

    2024年02月09日
    浏览(47)
  • HNU-数据挖掘-实验1-实验平台及环境安装

    计科210X 甘晴void 202108010XXX Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。Python 是 FLOSS(自由/开放源码软件)之一。Python 的设计具有很强的可读性,相比其他语言经常使用英文,其他语言的一些标点符号,它具有比其他语言更有特色语法

    2024年01月22日
    浏览(60)
  • 【数据挖掘】使用 Python 分析公共数据【01/10】

            本文讨论了如何使用 Python 使用 Pandas 库分析官方 COVID-19 病例数据。您将看到如何从实际数据集中收集见解,发现乍一看可能不那么明显的信息。特别是,本文中提供的示例说明了如何获取有关疾病在不同国家/地区传播速度的信息。         要继续操作,您需

    2024年02月12日
    浏览(49)
  • 如何使用Python进行数据挖掘?

    使用Python进行数据挖掘需要掌握以下几个关键步骤: 数据收集:首先,你需要获取你要进行数据挖掘的数据。可以从公共数据集、API、数据库等各种来源收集数据。 数据清洗:清洗数据是一个重要的步骤,它包括去除重复数据、处理缺失值、处理异常值、标准化数据等操作

    2024年02月16日
    浏览(58)
  • 数据挖掘神器Orange初步使用

    可以在官网下载,地址为Orange,如果已经装了Anaconda,则可在Anaconda Navigator中找到一个非常猥琐的图标,下面写着 Orange3 ,可以点击Install,装完之后点Launch就能用了。 当然也可以用命令行 安装完成后,可在命令行启动程序 也可以直接找到orange-canvas.exe,其路径在Orange/Script

    2024年02月08日
    浏览(49)
  • 数据挖掘(一)使用 Apriori 算法进行关联分析

    关联分析是一种在大规模数据集中寻找有趣关系的任务。 这些关系可以有两种形式: 频繁项集(frequent item sets): 经常出现在一块的物品的集合。 关联规则(associational rules): 暗示两种物品之间可能存在很强的关系。 关联分析(关联规则学习): 从大规模数据集中寻找物品间的

    2024年02月09日
    浏览(54)
  • 数据挖掘实验:使用 Hadoop 实现 WordCount 应用

    使用 Hadoop 实现WordCount 应用。 WordCount 是一个最简单的分布式应用实例,主要功能是统计输入目录中所有单词出现的总次数,如文本文件中有如下内容: Hello world 则统计结果应为: Hello 1 world 1 WordCount 可以使用多种方式实现,本次实验内容选择使用 Hadoop 实现 WordCount 程序,并

    2023年04月17日
    浏览(54)
  • 图解大数据 | 综合案例-使用Spark分析挖掘音乐专辑数据

    作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/84 本文地址:http://www.showmeai.tech/article-detail/178 声明:版权所有,转载请联系平台与作者并注明出处 收藏ShowMeAI查看更多精彩内容 文娱影音是目前大数据与AI应用最广泛的场景之一,本案例以音乐专辑发行数据为背景

    2024年02月09日
    浏览(53)
  • Python实战之使用Python进行数据挖掘详解

    1.1 数据挖掘是什么? 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,通过算法,找出其中的规律、知识、信息的过程。Python作为一门广泛应用的编程语言,拥有丰富的数据挖掘库,使得数据挖掘变得更加容易。 1.2 Python的优势 为什么我们要选

    2024年02月14日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包