【大厂AI课学习笔记】【2.1 人工智能项目开发规划与目标】(7)特征工程的基本方法

这篇具有很好参考价值的文章主要介绍了【大厂AI课学习笔记】【2.1 人工智能项目开发规划与目标】(7)特征工程的基本方法。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

今天来学习特征工程的基本方法。

基本方法包括:特征选择(Feature Selection)、特征提取(Feature Extraction)和特征构建(Feature Construction)。

一、特征选择(Feature Selection)

从给定的特征集合中选出相关特征子集的过程。

【大厂AI课学习笔记】【2.1 人工智能项目开发规划与目标】(7)特征工程的基本方法,学习笔记,人工智能,人工智能,学习,笔记

去除无关特征,降低特征学习难度,让模型简单,降低计算复杂度。

抛弃这部分特征(冗余特征),可能会降低模型的性能,计算复杂度 和 模型性能 之间的取舍。

要注意不能丢弃重要特征!

这是一个取舍的问题,诚然,数据决定着模型的性能和质量,但是数据维度过大,也是一个灾难。

二、特征提取(Feature Extraction)

一般是在特征选择之前,提取的对象是原始数据,目的是自动构建新特征(深度学习),将原始数据构建为一组具有明显物理意义(Gabor、纹理特征、几何特征)或统计意义的特征。

特征提取-转换;特征选择-挑选;

特征提取,是将原始数据进行转换,构建新的特征;特征选择则是挑选,进行数据的取舍。

三、特征构建(Feature Construction)

从原始数据中人工构建新的特征,观察原始数据,思考问题的潜在形式和数据结构,数据特殊性和机器学习实战有助于构建。

特征的构建,需要“读”数据,需要一定的创造力和想象力!这是非常有趣的环节!

【大厂AI课学习笔记】【2.1 人工智能项目开发规划与目标】(7)特征工程的基本方法,学习笔记,人工智能,人工智能,学习,笔记

比如上面的数据,要进行读和分析,看到有Dog和Cat两种动物,同时有时间,进行一定的转换,发现其中的规律和特征。

延伸学习:

(以下内容整理自网络、文心一言等出处,并非课程笔记,因此成为延伸学习,每篇笔记均有延伸学习的环节。如果相关定义和内容和笔记有出入,仅供参考。)

特征工程中的特征挑选、特征提取与特征构建

1. 特征挑选(Feature Selection)

定义:特征挑选是从原始特征集中选择出对模型预测性能有重要贡献的特征子集的过程。

场景:当数据集包含大量特征时,其中许多特征可能是冗余的、不相关的或噪声,这些特征会降低模型的性能。特征挑选旨在去除这些不相关或冗余的特征,提高模型的泛化能力和计算效率。

关键技术:常见的特征挑选技术包括过滤法(如方差阈值、相关系数、卡方检验等)、包装法(如递归特征消除、基于模型的特征选择等)和嵌入法(如基于树模型的特征重要性选择)。

举例:在信用卡欺诈检测中,原始数据集可能包含用户的交易金额、交易时间、交易地点等数十个特征。通过特征挑选,可以选择出如“交易金额”、“交易频率”、“异常交易地点”等对欺诈检测最为重要的特征,从而简化模型并提高性能。

2. 特征提取(Feature Extraction)

定义:特征提取是通过转换或组合原始特征,创造出新的、更有代表性的特征集的过程。

场景:当原始数据集中的特征不足以充分描述数据的内在结构或模式时,或者当特征维度过高导致计算复杂时,需要进行特征提取。

关键技术:常见的特征提取技术包括主成分分析(PCA)、线性判别分析(LDA)、独立成分分析(ICA)等降维方法,以及文本处理中的词袋模型、TF-IDF等。

举例:在图像识别中,原始数据是像素矩阵,直接将其作为特征会导致维度过高。通过特征提取技术如卷积神经网络(CNN),可以从原始像素中提取出边缘、纹理等低层次特征,再进一步组合成高层次的抽象特征,从而有效提高图像识别的准确性。

3. 特征构建(Feature Construction)

定义:特征构建是根据领域知识和对数据的理解,手动创造新的特征以捕获数据中重要信息的过程。

场景:当现有特征无法充分描述业务场景或目标变量时,或者当领域知识表明某些特定组合或变换对模型性能有显著提升时,需要进行特征构建。

关键技术:特征构建依赖于领域知识和数据分析技能,没有固定的技术方法。常见的操作包括特征的组合(如相乘、相加)、变换(如对数变换、幂变换)和编码(如独热编码、标签编码)等。

举例:在房价预测中,除了房屋的面积、卧室数等直接特征外,还可以通过特征构建创造出如“面积与卧室数的比值”、“每平方米的价格”等更有意义的特征。这些新构建的特征可能更能反映房价的实际影响因素,从而提高预测模型的准确性。

 文章来源地址https://www.toymoban.com/news/detail-835193.html

到了这里,关于【大厂AI课学习笔记】【2.1 人工智能项目开发规划与目标】(7)特征工程的基本方法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 人工智能入门学习笔记(一)

    家人们,好久不见哈!最近在尝试着学习人工智能的相关知识和具体技能呀。说实话,当像我这样的 小白初探人工智能体系 时,总是被很多未知的名词以及茫茫内容所淹没,便去想通过网络学习帮助自己建立正确的人工智能基本概念认知。在此,我便进一步对人工智能体系

    2024年02月02日
    浏览(39)
  • 【AI】了解人工智能、机器学习、神经网络、深度学习

    一、深度学习、神经网络的原理是什么? 深度学习和神经网络都是基于对人脑神经系统的模拟。下面将分别解释深度学习和神经网络的原理。 深度学习的原理: 深度学习是一种特殊的机器学习,其模型结构更为复杂,通常包括很多隐藏层。它依赖于神经网络进行模型训练和

    2024年02月06日
    浏览(25)
  • AI人工智能 机器学习 深度学习 学习路径及推荐书籍

    人工智能、机器学习和深度学习覆盖的技术范畴是逐层递减的,三者的关系:人工智能 机器学习 深度学习。 人工智能(ArtificialIntelligence,AI)是最宽泛的概念,是研发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学 机器学习(MachineLear

    2023年04月24日
    浏览(26)
  • 人工智能学习笔记六——CBOW模型

    连续词袋模型(CBOW)模型是word2vec下的一个模型,是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。 网络 以词表现,并且需猜测相邻位置的输入词,在word2vec中词袋模型假设下,词的顺序是不重要的。训练完成之后,

    2024年02月14日
    浏览(21)
  • 走进人工智能|强化学习 AI发展的未来引擎

    前言: 强化学习是一种通过智能体与环境交互,通过尝试最大化累计奖励来学习最优行为策略的机器学习方法。 本篇带你走进强化学习!一起来学习了解吧!!! 强化学习是一种机器学习方法,旨在通过试错来学习正确的行为。与其他机器学习方法不同,强化学习的主要目

    2024年02月10日
    浏览(26)
  • AI学术交流——“人工智能”和“神经网络学习”

    作者简介:一名云计算网络运维人员、每天分享网络与运维的技术与干货。   座右铭:低头赶路,敬事如仪 个人主页:网络豆的主页​​​​​ 目录 前言 一.人工智能 1.“人工智能之父” 2.达特茅斯会议(人工智能起源) 3.人工智能重要节点 二.神经网络 1.什么是神经网络

    2024年02月09日
    浏览(18)
  • 【AI】人工智能复兴的推进器之机器学习

    目录 一、机器学习的定义 二、机器学习的发展历程 2.1 萌芽期(20世纪50年代-60年代) 2.2 符号主义时期(20世纪60年代-80年代) 2.3 统计学习时期(20世纪90年代-21世纪初) 2.4 深度学习时期(21世纪初至今) 三、主要算法 3.1 线性回归(Linear Regression) 3.2 K-均值聚类(K-Means C

    2024年02月04日
    浏览(22)
  • 人工智能( 第 3 版)第一章学习笔记

    第 1 章 人工智能概述 1.0 引言 本文对人工智能的观点:人工智能是由人(people)、想法(idea)、方法(method)、机器(machine)和结果(outcome)等对象组成的。人通过机器(计算机)将自己的想法以某种方法进行实现,最终实现的东西称为结果。 研究人工智能或实现人工智能系

    2024年01月25日
    浏览(24)
  • 如何学习和规划类似ChatGPT这种人工智能(AI)相关技术

    学习和规划类似ChatGPT这种人工智能(AI)相关技术的路径通常包括以下步骤: 学习基础知识 : 学习编程:首先,你需要学习一种编程语言,例如Python,这是大多数人工智能项目的首选语言。 数学基础:深度学习和自然语言处理等领域需要一定的数学基础,包括线性代数、微

    2024年02月19日
    浏览(22)
  • 人工智能_PIP3安装使用国内镜像源_安装GIT_普通服务器CPU_安装清华开源人工智能AI大模型ChatGlm-6B_002---人工智能工作笔记0097

    接着上一节来看,可以看到,这里 创建软连接以后 可以看到执行python3 -V 就可以看到已经安装成功 python3 然后再去安装pip3  首先去下载软件,到/data/soft ,可以用wget命令也可以自己用浏览器下载 然后再去安装 python3 get-pip.py 可以看到报错了

    2024年02月21日
    浏览(25)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包