问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本)

这篇具有很好参考价值的文章主要介绍了问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本),赠书活动,推荐算法

🤵‍♂️ 个人主页:@艾派森的个人主页

✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+


目录

前言

一、为什么要学习推荐系统?

二、行业老兵拆解大厂技术细节

三、掌握核心基础:在线模块4大阶段

四、攻克难题,让推荐系统更丝滑

五、研发一线专家亲授,这些人最爱学

六、AI+未来势不可挡,小艾邀你乘风破浪

文末福利


前言

缺什么网购商城就推什么

想吃瓜瞬间就弹出相关新闻

想打卡的餐厅神速推出优惠团购

……

这大概是很多网民的日常——感觉大脑被装了监视器!

其实,在每一次浏览中,推荐系统的作用都举足轻重!它就好像掌握了“读心术”的AI,时时刻刻给你推荐感兴趣的内容。

自1994 年美国明尼苏达大学研究组推出第一个自动化推荐系统GroupLens,距今已有 29 年。

得益于腾讯、YouTube、快手等公司在推荐、广告等业务场景中的应用,当下推荐系统已经进入蓬勃发展、百花齐放的新时代,甚至已经有研究人员试图利用大模型来增强推荐系统了。

可见,推荐系统已经成为AI领域的热门选手之一!

今天,小艾就用这本《推荐系统技术原理与实践》揭开推荐技术的神秘面纱。

问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本),赠书活动,推荐算法

一、为什么要学习推荐系统?

虽然搭建推荐系统是门技术活,但弄清楚推荐系统的价值和意义,有助于开发者更好地打造真正造福浏览者和企业的优质系统。

维基百科对”推荐系统“的定义:一种信息过滤系统,主要功能是预测用户对物品的评分和偏好。

作者认为,推荐系统的核心“链接”用户和信息,既可以帮助用户发现他们感兴趣的信息,也可以将信息推送给感兴趣的用户。

经过20多年的积累和沉淀,推荐系统已经发展成为一门独立学科。它不仅应用广泛,还与很多其他跨学科知识和技术有着很强的关联性,比如人工智能、心理学、市场营销等。

问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本),赠书活动,推荐算法

不仅如此,国内外很多大厂都专研了相关理论和技术,比如Youtube、华为等国内外知名企业。

这样一门普及度高、覆盖面广、实用性强的技术,想必不论是从就业还是应用的角度,推荐系统对于开发者的吸引力都极强!

与此同时,推荐系统在互联网时代所面临的挑战与日俱增,需要从企业和用户端同时着手解决问题:

▮ 企业端:如何做到千人千面,为每个用户提供个性化的服务,提升产品的使用率和用户黏性?

▮ 用户端:面对海量的信息,如何高效检索自己感兴趣的内容?

想了解这些疑问,请各位开发者跟随小艾继续往下看。

二、行业老兵拆解大厂技术细节

除了对理论与问题的深入阐释,作者也以一个行业资深老兵的身份,对诸多论文与实践的技术细节都进行了深入解读:

YouTube 算法工程师的论文“Deep Neural Networks for YouTube Recommendations”指出了将优化用户观看时长设为最终优化目标的建模方法。根据另一篇有关强化学习的论文“Top- KOff-Policy Correction for a REINFORCE Recommender System”,模型上线后总的用户观看时长提升 0.86%。

问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本),赠书活动,推荐算法

 华为发表了PAL模型相关论文来解决位置偏置(position bias)问题,主要通过联合训练来消除这个问题,这样用户可以在更优的位置看见被推荐的信息。

问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本),赠书活动,推荐算法

 阿里巴巴的淘宝算法推荐团队提出了将优势特征蒸馏(Privileged Features Distillation,PFD)应用于淘宝推荐,CTR提升5%,CVR提升2.3%。此后,爱奇艺借鉴阿里妈妈提出的Rocket Training,最终,爱奇艺短视频场景响应时长提升6.5%,点击率提升2.3%;图文推荐场景响应时长提升4.5%,点击率提升14%。

问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本),赠书活动,推荐算法

 阿里定向广告的新一代粗排架构COLD则是新的算法和算力联合迭代视角下的产物。COLD把算力作为变量进行优化,可以实现效果和算力的平衡。它的训练和在线打分都是实时的,可以更好地适用数据分布的变化。COLD已经在阿里定向广告的各个主要业务上得到广泛应用并取得了显著的效果。

问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本),赠书活动,推荐算法

 相信如此细致的技术剖析,会让你在翻看本书时眼前一亮!

三、掌握核心基础:在线模块4大阶段

在作者看来,推荐系统本质上是为了解决“用户”和“资源”的匹配问题

为了满足这个要求,实践中可以将推荐系统按功能模块划分为离线、近线、在线和前端应用 4个模块。

其中最重要的是在线模块,因为它决定了“向用户推送什么”和“用户会看到什么”这两个核心问题,本书也将围绕推荐系统的在线模块展开讲解。

问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本),赠书活动,推荐算法

从图中可以看出,在线模块一般分为召回、粗排、精排和重排 4 个阶段。

▮ 召回阶段:主要根据用户部分特征,从海量信息里快速找出用户潜在感兴趣的内容,然后进入排序阶段。

传统的个性化召回主要基于协同过滤和矩阵分解,最近发展起来的模型化召回主要包括图表征召回、浅层模型化召回、深度匹配模型化召回以及语言模型化召回。

▮ 粗排阶段:通过少量用户和物品特征,使用简单模型对召回的结果进行简单排序。

粗排的目标是在满足算力约束的前提下,选出满足后链路需求的集合。与精排相比,粗排主要有算力约束和解空间问题两个特点:粗排有较严格的延迟约束,一般在 50ms 以内;线上打分的候选集更大,往往是精排候选集的数十倍。

▮ 精排阶段:精排是对候选集进行精准排序。

精排阶段是推荐系统最关键、最具技术含量的部分,也是大多数推荐技术聚焦提升的部分。特征工程及特征交叉的自动化一直是推动推荐系统技术演进最主要的方向。

▮ 重排阶段:选出满足数据多样性的最优组合,以及实现整体收益的最大化。

从整屏效果出发,精排给出的 Top-K 不一定是最优解,还要考虑上下文信息,因此需要重排再次优化。

这4个阶段不仅是推荐系统的基础,也是本书的脉络所在,全书内容均围绕这几个阶段展开。

可以看出,除了常用的手段,模型技术已经开始赋能在线模块的各个阶段,作者在书中也充分阐述了如何解决相关的痛点。

四、攻克难题,让推荐系统更丝滑

正如前文多次提到的,模型技术已经融入了推荐系统的开发。当然,在实际的模型训练中也出现了新的问题

一方面,模型的损失函数无法得到较低的值,没有真正收敛;另一方面,模型在训练集上拟合得很好,损失函数的值很低,但是在测试集上的效果却没有那么好。

如果能解决上述问题,推荐系统无疑会更加丝滑顺畅,给用户更好的体验感。

问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本),赠书活动,推荐算法

让我们看看作者是如何阐述解决方案的。

首先,这两个问题分别对应欠拟合和过拟合的概念。

▮ 欠拟合:指模型无法得到较低的训练误差

▮ 过拟合:指模型的训练误差远小于泛化误差

与这两个问题息息相关的因素是模型复杂度和训练集大小。平衡好这两个因素,就能解决欠拟合和过拟合问题。书中给出了如下思路。

一般来说,处理欠拟合通常有加大模型的规模、增加特征规模、减少正则化、修改模型结构这几种方法,每一种方法都各有特色:

▮ 加大模型的规模:使算法更好地拟合训练集,从而防止欠拟合。

▮ 增加特征规模:如果增加特征引起了过拟合,可以加入正则化来抵消。

▮ 减少正则化:通过减少 L1 正则、L2 正则或 dropout避免模型欠拟合。

▮ 修改模型结构:比如修改神经网络模型结构,可以同时影响训练误差和泛化误差。

与之对应的,处理过拟合的办法则包括减小模型规模、添加更多的训练数据、加入正则化、提前终止模型训练、通过特征选择减少特征的数量和种类等。

可以看出,过拟合与欠拟合对应的是相反的问题,因此大多数技术手段也是相反的。

过往,受限于技术水平,开发者需要在欠拟合和过拟合之间进行权衡。如今,数据可得性提升、算力更强,需要权衡的情况在变少,并且支持在不增加模型训练误差的同时降低泛化误差,推荐系统必将更加精准和人性化

五、研发一线专家亲授,这些人最爱学

读到这里,你会发现本书的脉络清晰、实践性强,对相关从业人员的技术困惑点把握得也更加细致。

这主要是因为作者文亮本身就是一名一线研发人员,拥有超过5年的机器学习与推荐系统实践经验,作为奇虎360推荐场景的核心研发人员,曾主导深度学习在奇虎360信息流推荐场景的落地工作。独具优势的背景让他能在书中兼顾系统性的理论和实践。

在作者看来,下面3类人群是最适合本书的目标读者

▮ 相关领域的开发人员:深入学习推荐系统的完整技术结构,并应用于业务工作中。

▮ 有机器学习基础、想进入推荐系统领域的初学者:了解推荐系统的技术原理以及大型互联网公司的业务实践。

▮ 计算机相关专业学生:从零开始了解推荐系统的知识体系。

此外,对推荐系统感兴趣的产品研发人员和运营人员也可以酌情阅读。

除了到位的基础知识和实践案例,书中还设置了“补充知识”板块来解读易被忽视的技术原理,每一章末尾还有汇总表格提炼精华技术方案。

问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本),赠书活动,推荐算法

问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本),赠书活动,推荐算法

 同时,异步社区(https://www.epubit.com/)也会一如既往地提供相关资源和后续服务。

六、AI+未来势不可挡,小艾邀你乘风破浪

如今,AI+推荐已经成为很多领域的一种趋势,通过数据分析、智能推荐等方式,为消费者提供更加个性化、精准的服务。

相信在未来,随着人工智能技术不断发展,推荐算法也会越来越成熟,在更多领域得到应用。希望读者能够以此书为契机,搭上这列数字化时代的快车!

文末福利

《推荐系统技术原理与实践》免费包邮送出5本!

问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本),赠书活动,推荐算法

  • 抽奖方式:评论区随机抽取5位小伙伴免费送出!
  • 参与方式:关注博主、点赞、收藏、评论区评论“人生苦短,拒绝内卷!”(切记要点赞+收藏,否则抽奖无效,每个人最多评论三次!
  • 活动截止时间:2023-08-12 20:00:00
  •  购买链接:《推荐系统技术原理与实践》

 名单公布时间:2023-08-12 21:00:00   

问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本),赠书活动,推荐算法文章来源地址https://www.toymoban.com/news/detail-635191.html

到了这里,关于问世28年经久不衰,大厂为何独爱这门技术?(文末送书5本)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 全新小米路由器问世:功能究竟新不新?

    小米在6月10日的媒体沟通会上发布了全新的小米路由器,根据小米官方的介绍,这款无线路由器造型与上一代产品大不相同,并采用了外置天线的设计。其支持802.11ac无线标准,配备了专业的PCB阵列天线,同时内置监控级硬盘并配有千兆有线端口;其中1TB版售价为699元,6TB版

    2024年02月08日
    浏览(46)
  • Python 代码格式化工具YAPF 0.17.0问世

    导读 YAPF 0.17.0 已发布,YAPF 是 Google 开源的一个用来格式化 Python 代码的工具。 目前用于 Python 的格式化程序(如 autopep8 和 pep8ify)都用于删除代码中的 lint 错误。这有很明显的局限性。YAPF 采用了不同的方法,基于 Daniel Jasper 开发的 “clang-format” 。从本质上来说,该算法取

    2024年02月05日
    浏览(83)
  • chatGPT4问世,作为一个程序员应当如何去理解?

    前几年 AI 发展也遇到过许多瓶颈,甚至很多AI投资者因为技术得不到突破而破产。但近几年AI技术飞速发展,特别是今天的主题chatGPT 第一次问世还只是一个帮学生写作业的工具,第二次迭代即可完成大部分市场业务,回答很多刁钻的问题。 有人测试过问chatGPT一些很难以回答

    2023年04月10日
    浏览(56)
  • FlyFlow:全新开源版问世,支持SpringBoot3+Flowable7

    经过精心打磨和严格测试,我们隆重推出全新FlyFlow开源版,这款源自商业版的强大工具,如今已完美融入SpringBoot3和Flowable7两大核心框架,为开发者带来前所未有的便捷与高效。 SpringBoot3的加持,让FlyFlow在简化开发流程、提升开发效率方面更上一层楼。而Flowable7的融入,则进

    2024年04月26日
    浏览(25)
  • 鹏云网络分布式块存储社区版问世,首发开源存储解决方案

          2023年1月,南京鹏云网络科技有限公司(简称:鹏云网络)正式宣布开源ZettaStor DBS分布式块存储系统,开放了自研10余年的分布式块存储技术,自此踏上了“自研”与“开源”一体并行的生态闭环之路。 研发十年,挑战块存技术上限       成本、效率、高可用,一直

    2024年02月11日
    浏览(37)
  • 提前3个月亮相,华为鸿蒙4.0问世,办公领域也迎来了全面升级

    你能想象吗? 有一天,你的手机、平板、电视、手表、车载系统等等这一切,都能运行在同一个操作系统上。 这个操作系统是咱们中国自己人研发的,那种感觉一定超棒吧! 这是一种期待,更是国人的自豪! 这一次,梦想照进现实,华为鸿蒙OS帮我们实现! 在本周即将要召

    2024年02月14日
    浏览(46)
  • GPT-4问世;LLM训练指南;纯浏览器跑Stable Diffusion

    1. 多模态 GPT-4正式发布:支持图像和文本输入,效果超越ChatGPT OpenAI的里程碑之作GPT-4终于发布,这是一个多模态大模型(接受图像和文本输入,生成文本)。主要能力有: GPT-4可以更准确地解决难题,具有更广泛的常识和解决问题的能力:更具创造性和协作性;可以接受图像

    2024年02月01日
    浏览(41)
  • vivo自研AI大模型即将问世,智能手机行业加速迈向AI时代

    当前,以大模型为代表的人工智能技术已发展为新一轮科技革命和产业变革的重要驱动力量,被视作推动经济社会发展的关键增长极。 AI大模型潮起,千行百业走向百舸争流的AI创新应用期,前沿信息技术向手机、PC、车机等消费级终端加速渗透,不断孕育新业态、新场景、新

    2024年02月06日
    浏览(38)
  • 微软称在量子纠错领域取得大进展,量子超级计算机能在2033年问世?

    大数据产业创新服务媒体 ——聚焦数据 · 改变商业 自从物理学家费曼(Richard Feynman)在80年代首次提出了利用量子力学原理进行计算的概念,无数科学家就梦想着用量子计算重塑未来。可惜现实往往“磕磕绊绊”,40多年过去了,量子计算依然囿于实验室,难以真正落地应

    2024年04月24日
    浏览(34)
  • 再见ChatGPT,又一值得国内程序员体验的AI生产力工具问世

    众所周知目前 ChatGPT 很火,对于国内用户来说想要亲身体验一下,还是有一定难度的,毕竟从注册账号的第一步就被卡死了。 在得知微软推出了新必应以后,相信很多小伙伴都去申请体验了,但是很遗憾,相信大家应该一直都是卡在下面这个页面。 是的没错,一直在候补名

    2024年02月02日
    浏览(82)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包