AI-应试-机器学习公式推导与代码实现-1预备
(AI算法系列)
1知识点
- 机器学习
- 背景
- 训练过程
- 应用场景
- 局限及挑战
- 未来
2具体内容
2.1机器学习
- 模型:要学习的决策函数或条件概率分布
- 策略:决定按什么标准选最优模型-》loss
- 分类:对数、交叉熵
- 回归:均方
- 算法:具体的优化求解算法:梯度下降、牛顿法、拟牛顿法
2.2 核心:从数据中最大程度归纳总结出普遍规律
-
欠拟合:继续学
-
过拟合:把噪声也学到了
- 训练误差
- 正则化(惩罚项)
- 正则化参数的同时最小化经验误差
-
泛化能力:最大程度拟合训练数据,对未知测试数据有好的泛化能力
-
方法:数据采集、特征工程、算法调优
2.3流程
需求分析-数据采集(自有+爬)-数据清洗-数据分析可视化(探索性)-特征工程(选择与组合)-建模调优-展示输出(基于结果的业务决策分析)-部署上线优化(落地)
2.4性能度量
-
分类:
-
混淆矩阵Confusion Matrix
-
准确率Accuracy
-
精确率Precision(查准率):精确率针对预测结果而言,表示的是预测为正的样本中有多少是真正的正样本
-
召回率Recall(查全率):召回率是针对原样本而言,表示的是样本中的正例有多少被预测正确了
-
精确率Precision(查准率):精确率针对预测结果而言,表示的是预测为正的样本中有多少是真正的正样本
-
F1 Score
-
P-R曲线
-
ROC曲线
-
AUC:area under curve:ROC曲线下面积,随机挑选一个正样本及一个负样本,分类器判定正样本的值高于负样本的概率即AUC
-
-
回归:
- 平均绝对误差MAE
- 均方误差MSE
- 均方根误差RMSE(开根号)
- RSquare
- 调整RSquare
2.5工具库:
- Numpy:数组构建、索引与切片、基础运算、维度变换和数组合并与切分
- 创建数组
- 索引切片
- 基础运算
- 维度变换
- 合并与切分
- Scikit-learn:模型和算法实现主要建立在NumPy、SciPy和matplotlib等Python核心库上,对主流的监督学习和无监督学习模型与算法均有较好的支持;六大模块,分类、回归、聚类、降维、模型选择、预处理;
###2.6模型体系: - 监督
- 单模型
- 线性模型
- 线性回归
- 对数几率回归logistics
- LASSO
- Ridge
- LDA
- k近邻
- 决策树
- ID3
- C4.5、C5.0
- CART
- NN
- 感知机
- 神经网络
- SVM
- 线性可分
- 线性支持
- 线性不可分
- 线性模型
- 集成模型
- Boosting
- GBDT
- AdaBoost
- XGBoost
- LightGBM
- CatBoost
- Bagging:随机森林
- Boosting
- 概率模型
- CRF
- HMM
- 单模型
- 无监督
- 聚类
- kNN k均值聚类
- 层级聚类
- 谱聚类
- 降维
- PCA
- SVD
- 聚类
- 概率
- EM算法
- MCMC
- 贝叶斯
- 朴素贝叶斯
- 贝叶斯网络
- 概率图
- CRF
- HMM
- 最大信息熵
3待补充
无文章来源地址https://www.toymoban.com/news/detail-436566.html
4Q&A
无文章来源:https://www.toymoban.com/news/detail-436566.html
5code
无
6参考
- https://github.com/luwill/Machine_Learning_Code_Implementation
到了这里,关于AI-应试-机器学习公式推导与代码实现-预备的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!