在传统的软件工程中,核心是代码,然而,在机器学习项目中,重点则是特征——也就是说,开发人员优化模型的方法之一是增加和改进其输入特征。很多时候,优化特征比优化模型带来的增益要大得多。
笔者曾经参与过一个“商品推荐”的项目,在项目中,笔者发现商品的类目(划分类别的标记,如纸品家清、米面粮油、数码产品等)虽然有 100 多个,但是运营人员经验不足,将超过 70% 的商品采用了默认的类目(精品好货)标记。如此一来,原本可以用来标记商品类型的关键特征(类目)的实际作用大打折扣。于是,我们重新整理了这个特征,将所有商品重新标记,在未改变算法模型的前提下,推荐效果(uvctr)提升了8%+。
目录
1.将原始数据映射到特征文章来源:https://www.toymoban.com/news/detail-513868.html
1.1 映射数值文章来源地址https://www.toymoban.com/news/detail-513868.html
到了这里,关于机器学习7:特征工程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!