机器学习基本概念简介

这篇具有很好参考价值的文章主要介绍了机器学习基本概念简介。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、机器学习是在干什么?

以中学时代所学的函数为例,做应用题时我们都会建立相应的正比例函数、二次函数等来解决,给定一个自变量x都能得到唯一的因变量y。现在我想找到一个函数ƒ,它的输入并不是数字,而是一段语音,最后相应的文字,亦或输入的是一副图片,最后输出的是图片中的内容,那么如何求解该函数?显然,人类做不到,那就交给机器(计算机)来找!

 

二、不同类型的函数(亦即不同的任务)


Regression(回归问题类):输出的是scalar(标量),标量只有大小而无方向,可以表示温度、湿度、长度等。>scalar(标量),标量只有大小而无方向,可以表示温度、湿度、长度等。


Classification(分类):给一些选项或类别,函数可以输出正确的一类(class),一个one-hot向量


Structured Learning(结构化预测):输出一个句子或一张图......输出的是结构化结果

 

三、机器学习的三个步骤

以预测隔天的视频点击量为例

1. Function with unkonwn parameters


写出一个带有未知参数的函数,先预测一下这个函数会是什么形式(基于数据所在领域的一些先验知识)

设:\(y = b + w*x_1\),其中y是要预测的第二天的值,\(x_1\)是当天已知的值,\(b\)\(w\)是未知的参数,要通过后面的步骤来确定(从大量数据中学习)

 

2. Define Loss from Training Data
Loss是一个函数,输入的参数就是第1步中未知的b和w,记为$L(b, w)$


Loss函数判断的是当确定一组b和w时,输出的数据“好不好”


假设b = 0.5k,w = 1,即\(L(0.5k, 1)\),有\(y = 0.5k + x_1\),我们要判断此时该函数是否够准确,即预测值与实际值(Label)之间的误差大不大


假如我们将每天的实际点击量与预测点击量作差,然后累加求平均值,即 \(L = \frac{1}{N}\sum_n{e_n}\)


其中N表示training data的个数,n代表有多少天,\(e_n\)表示每天的误差。则L越大,代表当前选择的\(b\)\(w\)不好,L越小代表这一组参数越好。


注意其中\(e = \lvert y - \widehat{y} \rvert\) L is mean absolute error(MAE:平均绝对误差);

\(e = (y - \widehat{y}) ^2\),L is mean square error(MSE:均方误差),两种方法可以根据实际情况确定

 

3. Optimization


解一个最优化问题,如本例中我们要找到一组最好的w与b,即\(w^*,b^* = arg min_{w,b} L\),我们用到的optimization方法是Gradient Descent即梯度下降法


Graient Descent
简化一下,假如目前我们只考虑参数w

  • (randomly)pick an initial \(w^0\)
  • Compute $\dfrac{\partial y}{\partial x}|_{w = w^0} $
  • Update \(w\) iteratively
    \(w^1 \leftarrow w^0 - \eta\dfrac{\partial L}{\partial w}|_{w = w^0}\)
    机器学习基本概念简介

    当偏导数为负时,左高右低 $\longrightarrow $ Loss函数递减 $\longrightarrow $ 增大w使其值减小

    当偏导数为正时,左低右高 $\longrightarrow $ Loss函数递增 $\longrightarrow $ 减小w使其值减小

机器学习基本概念简介

也就是说我要朝哪个方向迈出去走到新的 \(w_1\)处,走的这段距离不仅与偏导数有关,还与 学习率(learning rate)\(\eta\) 有关,即 \(\eta\dfrac{\partial L}{\partial w}|_{w = w^0}\)
这里的 \(\eta\) 是自己根据情况自行设定的,在机器学习中自己设定的参数叫 hyperparameters

w走到什么时候会停止?一是可以自己设定,求多少次微分后就停止;二是找到一个最小值时


回到最初的两个参数的情况,即\(w^*,b^* = arg min_{w,b} L\)文章来源地址https://www.toymoban.com/news/detail-852413.html

  • (Randomly)Pick initial values \(w^0\), \(b^0\)
  • Compute \(\dfrac{\partial L}{\partial w}|_{w = w^0, b = b^0}\) \(\dfrac{\partial L}{\partial b}|_{w = w^0, b = b^0}\)
  • Update \(w\), \(b\) iteratively
    \(w^1 \leftarrow w^0 - \eta\dfrac{\partial L}{\partial w}|_{w = w^0}\)
    \(b^1 \leftarrow b^0 - \eta\dfrac{\partial L}{\partial b}|_{b = b^0}\)
    不停地更新下去,直到找到一组最优值
    机器学习基本概念简介

到了这里,关于机器学习基本概念简介的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 机器学习的第一节基本概念的相关学习

    目录 1.1 决策树的概念 1.2 KNN的概念 1.2.1KNN的基本原理 1.2.2 流程: 1.2.3 优缺点 1.3 深度学习 1.4 梯度下降 损失函数 1.5 特征与特征选择 特征选择的目的 1.6 python中dot函数总结 一维数组的点积: 二维数组(矩阵)的乘法: 多维数组的乘法: 1.7  suffler   打乱 1.8 特征和标签 1

    2024年02月10日
    浏览(48)
  • 机器学习中最基本的概念之一:数据集、样本、特征和标签

    数据集、样本、特征和标签是机器学习中的重要概念,这些概念在机器学习算法的设计和实现过程中起着至关重要的作用。在本文中,我们将对这些概念进行详细的讲解,以便更好地理解机器学习算法的基本原理和应用。 数据集是机器学习中最基本的概念之一,它是指一组相

    2024年02月09日
    浏览(36)
  • 人工智能基础_机器学习001_线性回归_多元线性回归_最优解_基本概念_有监督机器学习_jupyter notebook---人工智能工作笔记0040

       线性和回归,就是自然规律,比如人类是身高趋于某个值的概率最大,回归就是通过数学方法找到事物的规律. 机器学习作用: 该专业实际应用于机器视觉、指纹识别、人脸识别、视网膜识别、虹膜识别、掌纹识别、专家系统、自动规划、智能搜索、定理证明、博弈、自动程序

    2024年02月06日
    浏览(53)
  • Docker(一)简介和基本概念

    作者主页: 正函数的个人主页 文章收录专栏: Docker 欢迎大家点赞 👍 收藏 ⭐ 加关注哦! 本章将带领你进入 Docker 的世界。 什么是 Docker ? 用它会带来什么样的好处? 好吧,让我们带着问题开始这神奇之旅。 Docker 最初是 dotCloud 公司创始人 Solomon Hykes 在法国期间发起的一

    2024年01月19日
    浏览(39)
  • Flink的简介以及基本概念

    有界流和无界流 有状态的流处理 2.1集群角色 2.2 部署模式 会话模式(Session Mode) 单作业模式(Per-Job Mode) 应用模式(Application Mode) 3.1  系统架构 1 )作业管理器(JobManager) JobManager是一个Flink集群中任务管理和调度的核心,是控制应用执行的主进程。也就是说,每个应用

    2024年04月09日
    浏览(57)
  • 区块链基本概念与当前生态简介

    区块链是一种去中心化的分布式账本技术,它通过将数据按照时间顺序链接成区块,并使用密码学算法确保数据的安全性和完整性。每个区块包含一定数量的交易记录,而且每个区块都包含了前一个区块的哈希值,这样形成了一个不可篡改的链式结构。 区块链的基本概念包括

    2024年02月12日
    浏览(37)
  • 什么是机器学习?监督学习的定义、概率论的基本概念以及模型选择、过拟合与欠拟合的问题。常见的监督学习算法,包括朴素贝叶斯(Naive Bayes)、决策树(Decision Tree)支持向量机随机森林

    作者:禅与计算机程序设计艺术 什么是机器学习?从定义、发展历程及目前的状态来看,机器学习由3个主要分支组成:监督学习(Supervised Learning),无监督学习(Unsupervised Learning)和强化学习(Reinforcement Learning)。这三类学习都可以使计算机系统根据输入数据自动分析和改

    2024年02月09日
    浏览(52)
  • 机器学习之图像处理——基本概念知识介绍

    图像分析一般利用数学模型并结合图像处理的技术来分析底层特征和上层结构,到从而提取具有一定智能性的信息,其中对图片内容分析,图片内容识别和检测都离不开图像的分类。 图像分类目标:已有固定的分类标签集合,然后对于输入的图像,从分类标签集合中找出一个

    2024年02月07日
    浏览(43)
  • Git简介与工作原理:了解Git的基本概念、版本控制系统和分布式版本控制的工作原理

    🌷🍁 博主 libin9iOak带您 Go to New World.✨🍁 🦄 个人主页——libin9iOak的博客🎐 🐳 《面试题大全》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~🌺 🌊 《IDEA开发秘籍》学会IDEA常用操作,工作效率翻倍~💐 🪁🍁 希望本文能够给您带来一定的帮助🌸文章粗浅,敬

    2024年02月16日
    浏览(64)
  • 【概念】还在为fabric而烦恼?这是在我理解下的fabric 关键概念,拥有这一篇就够了

    如果,非要在每一条链中评选出几个比较好用且概念简单的链的话,公有链就是Bitcoin(比特币网络) 和 Ethereum(以太坊),私有链也是以太坊,而联盟链可以说是很少很少国产的FISCO-BCOS算一个 咦?我们这不是hyperledger fabric(以下简称fabric)的专场吗?怎么没有他呢? 是这

    2024年02月12日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包