【机器学习】sklearn数据集的使用,数据集的获取和划分

这篇具有很好参考价值的文章主要介绍了【机器学习】sklearn数据集的使用,数据集的获取和划分。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

「作者主页」:士别三日wyx
「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者
「推荐专栏」:对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》

json_decode() 可以对JSON字符串「解码」,并转换为PHP变量。

语法

mixed json_decoce( $json_str, assoc, depth, options )

参数

  • $json_str :需要解码的JSON字符串,只能处理UTF-8编码的数据
  • assoc :布尔类型,true返回数组,(默认)false返回对象
  • depth :整数类型,递归的深度(默认512层),最大 2147483647 层
  • options :二进制掩码,目前只支持 JSON_BIGINT_AS_STRING

返回值

  • 通过恰当的类型,返回解码后的数据,默认返回对象类型。
  • JSON格式错误 或 超过递归解析深度 或 false 或 null,就返回null。

一、返回数组类型

json_decode() 默认返回「对象」类型,如果想返回「数组」类型,就将 assoc 参数设置为true。 assoc 参数可省略,默认为false。

实例:

var_dump(json_decode('{"key1":"value1","key2":"value2"}'));
var_dump(json_decode('{"key1":"value1","key2":"value2"}', true));

输出:

object(stdClass)#1 (2) {
  ["key1"]=>
  string(6) "value1"
  ["key2"]=>
  string(6) "value2"
}
array(2) {
  ["key1"]=>
  string(6) "value1"
  ["key2"]=>
  string(6) "value2"
}

options 参数设置为 JSON_OBJECT_AS_ARRAY 时,也可以转换成「数组」类型。

实例:

var_dump(json_decode('{"key1":"value1","key2":"value2"}', JSON_OBJECT_AS_ARRAY));

输出:

array(2) {
  ["key1"]=>
  string(6) "value1"
  ["key2"]=>
  string(6) "value2"
}

二、JSON的键和值必须用双引号

「解析」的JSON字符串,最外侧用单引号包裹,里面的键值对用「双引号」包裹,才能正常解析,否则会返回null。

实例:

var_dump(json_decode('{"key1":"value1","key2":"value2"}'));
var_dump(json_decode("{'key1':'value1','key2':'value2'}"));

输出:

object(stdClass)#1 (2) {
  ["key1"]=>
  string(6) "value1"
  ["key2"]=>
  string(6) "value2"
}
NULL

这时,(PHP 7.3以上)可以设置参数 options 为JSON_THROW_ON_ERROR,使其在解析错误时抛出异常,方便我们及时处理错误。


三、返回null问题

除了刚才提到的JSON字符串格式错误会返回null,还有其他的原因。

遇到返回null的问题时,可以在 json_decode() 后面,打印 json_last_error() 查看错误。

实例:

var_dump(json_decode("{'key1':'value1','key2':'value2'}"));
echo json_last_error();

输出:

NULL
4

json_last_error() 返回值解析:

  • 0 = JSON_ERROR_NONE //没有错误
  • 1 = JSON_ERROR_DEPTH //超过最大堆栈深度
  • 2 = JSON_ERROR_STATE_MISMATCH //无效或异常的json
  • 3 = JSON_ERROR_CTRL_CHAR //控制字符错误,可能是编码不对
  • 4 = JSON_ERROR_SYNTAX //JSON字符串语法错误
  • 5 = JSON_ERROR_UTF8 //异常的UTF-8字符,只能处理UTF8编码的数据

四、大整数问题

options 参数设置为 JSON_BIGINT_AS_STRING,可以将超过PHP整型「最大值」的整数解析为字符串。


五、传入非字符串类型

如果传入的不是字符串类型,就不会解码,或者说「无法解码」

  • 数值型会原样返回
  • 运算符会运算后返回运算结果
  • 布尔型(true返回1,false返回NULL)
  • null会返回NULL

实例:

var_dump(json_decode(10));
var_dump(json_decode(10.11));
var_dump(json_decode(1*2));
var_dump(json_decode(true));
var_dump(json_decode(false));
var_dump(json_decode(null));

输出:

int(10)
float(10.11)
int(2)
int(1)
NULL
NULL

六、强制类型转换

解码后进行「强制类型转换」

实例:

var_dump((array)json_decode(10));
var_dump((int)json_decode(false));

输出:文章来源地址https://www.toymoban.com/news/detail-498735.html

array(1) {
  [0]=>
  int(10)
}
int(0)

到了这里,关于【机器学习】sklearn数据集的使用,数据集的获取和划分的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Python机器学习】sklearn.datasets回归任务数据集

    为什么回归分析在数据科学中如此重要,而 sklearn.datasets 如何助力这一过程? 回归分析是数据科学中不可或缺的一部分,用于预测或解释数值型目标变量(因变量)和一个或多个预测变量(自变量)之间的关系。 sklearn.datasets 模块提供了多种用于回归分析的数据集,这些数据

    2024年02月07日
    浏览(49)
  • 【Python机器学习】sklearn.datasets分类任务数据集

    如何选择合适的数据集进行机器学习的分类任务? 选择合适的数据集是进行任何机器学习项目的第一步,特别是分类任务。数据集是机器学习任务成功的基础。没有数据,最先进的算法也无从谈起。 本文将专注于 sklearn.datasets 模块中用于分类任务的数据集。这些数据集覆盖

    2024年02月07日
    浏览(39)
  • 机器学习样本数据划分的典型Python方法

    Date Author Version Note 2023.08.16 Dog Tao V1.0 完成文档撰写。 In machine learning and deep learning, the data used to develop a model can be divided into three distinct sets: training data, validation data, and test data. Understanding the differences among them and their distinct roles is crucial for effective model development and evaluation. Trai

    2024年02月12日
    浏览(45)
  • 机器学习理论笔记(二):数据集划分以及模型选择

    欢迎来到蓝色是天的机器学习笔记专栏!在上一篇文章《机器学习理论笔记(一):初识机器学习》中,我们初步了解了机器学习,并探讨了其定义、分类以及基本术语。作为继续学习机器学习的进一步之旅,今天我们将进一步讨论机器学习中的一些重要概念和技巧。 在本文

    2024年02月11日
    浏览(36)
  • 机器学习:基于逻辑回归和高斯贝叶斯对人口普查数据集的分类与预测

    机器学习:基于逻辑回归和高斯贝叶斯对人口普查数据集的分类与预测 作者:i阿极 作者简介:Python领域新星作者、多项比赛获奖者:博主个人首页 😊😊😊如果觉得文章不错或能帮助到你学习,可以点赞👍收藏📁评论📒+关注哦!👍👍👍 📜📜📜如果有小伙伴需要数据

    2023年04月08日
    浏览(40)
  • 人工智能基础_机器学习003_有监督机器学习_sklearn中线性方程和正规方程的计算_使用sklearn解算八元一次方程---人工智能工作笔记0042

    然后我们再来看看,如何使用sklearn,来进行正规方程的运算,当然这里 首先要安装sklearn,这里如何安装sklearn就不说了,自己查一下 首先我们还是来计算前面的八元一次方程的解,但是这次我们不用np.linalg.solve这个 解线性方程的方式,也不用 直接 解正规方程的方式: 也就是上面这种

    2024年02月08日
    浏览(52)
  • 泰坦尼克号沉船数据分析与可视化、数据建模与分类预测【Python | 机器学习-Sklearn】

    前言:泰坦尼克号,不只是卡梅隆导演的经典电影,它是一个真实存在的悲剧,也是电影的故事背景与题材。作为一个IT人,分析事实还得看数据,了解到泰坦尼克号沉船幸存者多为老人、小孩和妇女,而牺牲者多为年轻的男士,这样的历史数据,让我感受到了人性之美与善

    2024年02月02日
    浏览(49)
  • ubuntu深度学习使用TensorFlow卷积神经网络——图片数据集的制作以及制作好的数据集的使用

    首先我事先准备好五分类的图片放在对应的文件夹,图片资源在我的gitee文件夹中链接如下: 文件管理: 用于存各种数据 https://gitee.com/xiaoxiaotai/file-management.git  里面有imgs目录和npy目录,imgs就是存放5分类的图片的目录,里面有桂花、枫叶、五味子、银杏、竹叶5种植物,npy目

    2024年02月05日
    浏览(65)
  • 基于LIDC-IDRI肺结节肺癌数据集的放射组学机器学习分类良性和恶性肺癌(Python 全代码)全流程解析 (一)

    第二部分传送门 LIDC-IDRI数据集是用于医学影像分析的公开数据集,包含1010例低剂量CT扫描和人工标注的肺部结节信息。这些数据对于肺癌早期检测和算法开发至关重要。由美国国立卫生研究院(NIH)资助,该数据集为研究人员提供了宝贵资源,促进了医学影像处理和人工智能

    2024年04月27日
    浏览(32)
  • sklearn机器学习库(一)sklearn中的决策树

    sklearn中决策树的类都在”tree“这个模块之下。 tree.DecisionTreeClassifier 分类树 tree.DecisionTreeRegressor 回归树 tree.export_graphviz 将生成的决策树导出为DOT格式,画图专用 tree.export_text 以文字形式输出树 tree.ExtraTreeClassifier 高随机版本的分类树 tree.ExtraTreeRegressor 高随机版本的回归树

    2024年02月13日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包