python 数据挖掘库orange3 介绍

这篇具有很好参考价值的文章主要介绍了python 数据挖掘库orange3 介绍。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

orange3 是一个非常适合初学者的data mining library. 它让使用者通过拖拽内置的组件来形成工作流。让你不需要写任何代码就可以体验到数据挖掘和可视化的魅力。

它的桌面如下,这里我创建了 3 个节点,分别是数据集、小提琴图,散点图
python 数据挖掘库orange3 介绍,python,数据挖掘,开发语言

其中 Datasets 是从 左边的 Data 组件库中拖拽过来的,Datasets 是 orange3 内置的数据集,比如非常常用的iris(鸢尾花) 数据集。双击桌面上的 Datasets 就能选择不同的数据集来作为下一步的数据来源。
python 数据挖掘库orange3 介绍,python,数据挖掘,开发语言
点击左下角的预览按钮,可以像 excel 一样预览这个数据集

可视化

先看一下散点图, x 轴选择了 sepal(花萼长度), y轴是 花的类别,可以看出,相关性并不是很强,有很大一段x 轴的区域,三种类别都有可能。

python 数据挖掘库orange3 介绍,python,数据挖掘,开发语言
我们换一个 x 轴,选择 petal length (花瓣长度),发现相关性很大,基本上很容易区分开
python 数据挖掘库orange3 介绍,python,数据挖掘,开发语言

小提琴图

小提琴图主要表现的是某个特征的分布情况。下图表现了三种花的 petal length 分布,可以看出蓝色的 Iris-setosa 分布的比较集中,而且与其他的类别没有重叠。
这意味着,当你看看到一株 petal length(花瓣长度) 小于2.5的时候,几乎可以断定它属于setosa属
python 数据挖掘库orange3 介绍,python,数据挖掘,开发语言
有趣的是,至于花萼(sepal)的宽度,setosa属比起其它属看起来却趋向于长尾分布(小提琴更窄),说明它的分布范围随机性更大。
python 数据挖掘库orange3 介绍,python,数据挖掘,开发语言
再看一个热力图
python 数据挖掘库orange3 介绍,python,数据挖掘,开发语言
可以看出三种花(x轴的三个颜色) 中,y 轴是四个属性, Iris-setosa 的petal length 这个属性明显和其它两种有区别,可以作为一个直观的区分属性。文章来源地址https://www.toymoban.com/news/detail-744022.html

到了这里,关于python 数据挖掘库orange3 介绍的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • GEO数据挖掘(一)基础介绍

    生信技能树学徒学习第二周 一、GEO数据库简介        GEO全称Gene Expression Omnibus data base,由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库(通过NCBI首页,All Databases下拉框中选择GEO DataSets)。收录了世界各国研究机构提交的高通量基因表达数据。2000年开始建立的时

    2024年02月13日
    浏览(29)
  • 信息检索与数据挖掘 |(一)介绍

    信息检索是从 大规模非结构化数据 (通常是文本)的集合(通常保存在计算机上)中找出 满足用户信息需求的资料 (通常是文档)的过程。 结构化数据 倾向于引用“表格”中的信息,通常允许数值范围和精确匹配查询。 非结构化数据 通常引用自由文本,指的是那些没有

    2024年02月09日
    浏览(31)
  • 泰迪大数据挖掘建模平台功能特色介绍

    大数据挖掘建模平台面相 高校、企业级别用户快速进行数据处理的建模工具 。   大数据挖掘建模平台介绍      平台底层算法基于R语言、Python、Spark等引擎,使用JAVA语言开发,采用   B/S 结构,用户无需下载客户端,可直接通过浏览器进行访问;且在没有编程基础的情况下

    2024年02月12日
    浏览(47)
  • 数据挖掘-实战记录(一)糖尿病python数据挖掘及其分析

    一、准备数据 1.查看数据 二、数据探索性分析 1.数据描述型分析 2.各特征值与结果的关系 a)研究各个特征值本身类别 b)研究怀孕次数特征值与结果的关系 c)其他特征值 3.研究各特征互相的关系 三、数据预处理 1.去掉唯一属性 2.处理缺失值 a)标记缺失值 b)删除缺失值行数  c

    2024年02月11日
    浏览(43)
  • 数据挖掘|序列模式挖掘及其算法的python实现

    序列(sequence)模式挖掘也称为序列分析。 序列模式发现(Sequential Patterns Discovery)是由R.Agrawal于1995年首先提出的。 序列模式寻找的是事件之间在顺序上的相关性。 例如,“凡是买了喷墨打印机的顾客中,80%的人在三个月之后又买了墨盒”,就是一个序列关联规则。对于保险

    2024年04月09日
    浏览(49)
  • Python实现图书数据挖掘系统(数据仓库)

    目 录 摘 要 I Abstract II 第1章 绪论 1 1.1选题背景及意义 1 1.2国内外研究现状 1 1.3发展趋势 2 第2章 系统需求分析 3 2.1任务描述 3 2.2需求分析 3 2.3 系统目标 4 第3章 系统概要设计 5 3.1 系统用户分析 5 3.2 系统功能分析 6 3.3 系统算法分析 9 第4章 系统详细设计 12 4.1 数据管理 12 4.2

    2024年02月12日
    浏览(34)
  • 【数据挖掘】使用 Python 分析公共数据【01/10】

            本文讨论了如何使用 Python 使用 Pandas 库分析官方 COVID-19 病例数据。您将看到如何从实际数据集中收集见解,发现乍一看可能不那么明显的信息。特别是,本文中提供的示例说明了如何获取有关疾病在不同国家/地区传播速度的信息。         要继续操作,您需

    2024年02月12日
    浏览(40)
  • Python数据分析与数据挖掘:解析数据的力量

    随着大数据时代的到来,数据分析和数据挖掘已经成为许多行业中不可或缺的一部分。在这个信息爆炸的时代,如何从大量的数据中提取有价值的信息,成为了企业和个人追求的目标。而Python作为一种强大的编程语言,提供了丰富的库和工具,使得数据分析和数据挖掘变得更

    2024年02月11日
    浏览(52)
  • Python高效实现网站数据挖掘

    在当今互联网时代,SEO对于网站的成功至关重要。而Python爬虫作为一种强大的工具,为网站SEO带来了革命性的改变。通过利用Python爬虫,我们可以高效地实现网站数据挖掘和分析,从而优化网站的SEO策略。本文将为您详细介绍如何利用Python爬虫进行数据挖掘和分

    2024年02月07日
    浏览(30)
  • 如何使用Python进行数据挖掘?

    使用Python进行数据挖掘需要掌握以下几个关键步骤: 数据收集:首先,你需要获取你要进行数据挖掘的数据。可以从公共数据集、API、数据库等各种来源收集数据。 数据清洗:清洗数据是一个重要的步骤,它包括去除重复数据、处理缺失值、处理异常值、标准化数据等操作

    2024年02月16日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包