宋绪杰:我的大数据成长之旅 | 提升之路系列(三)

这篇具有很好参考价值的文章主要介绍了宋绪杰:我的大数据成长之旅 | 提升之路系列(三)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

宋绪杰 清华大学,大数据


导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

两年前,我成为了清华大学车辆学院的一名硕士生,随着对专业认识的不断深入,我发现车辆领域的前沿研究逐渐走向了智能化,以自动驾驶为代表的前沿技术将彻底重塑未来生活。置身于智能化的浪潮之中,我意识到必须顺应时代潮流,“大数据能力提升项目”的培养方案使我眼前一亮,于是在入学之初便完成了报名,开始了我的“大数据成长之旅”。

 

宋绪杰 清华大学,大数据

图1生活照

一、勤思好学,夯实学科基础

为筑牢大数据与人工智能学科基础,我选择了4门课程:深度学习(A-)、统计学习理论与应用(A)、大数据分析(A)以及大数据实践课(A-)。在硕士期间,包括这4门课程在内的所有课程均获A-及以上成绩,GPA达到4.0满绩,GPA排名院系第一。大数据项目的课程使我系统性地掌握了大数据与人工智能的学科知识,为后续的研究打下了坚实基础。

基于深度学习、统计学习课程学习到的知识,我们在大数据分析、大数据实践课程中分别参加了两项竞赛——天池-淘宝穿衣搭配挑战赛、中国高校计算机大赛-微信大数据挑战赛。在淘宝穿衣搭配挑战赛中,最终排名21/3408;在微信大数据挑战赛中,获得了全国三等奖。也正是大数据项目中扎实的实践和理论学习,让我顺利在商汤科技、旷视科技、阿里巴巴进行了三段实习,给了我继续深耕数据科学和AI领域的底气。

二、不负韶华,学科交叉创新

大数据项目也让激发了我的研究思路。以自动驾驶为代表的工业决控任务急需智能化改进,强化学习正是智能决控方法的代表,然而强化学习输出的控制动作通常具有波动性,不能真正满足现实世界中高精度决控任务的需求。为解决这一问题,我开始了以强化学习动作平滑性为主题的研究,希望为强化学习在工业场景的真正落地添砖加瓦。

对于强化学习的动作震荡问题,我曾在深度学习的课间休息时间请教过龙明盛老师,而后基于深度学习课程中系统性讲授过的神经网络设计思路,我设计了具有Lipschitz连续性的Actor网络——LipsNet,使强化学习的动作震荡问题得到了很好的改善。在这项工作中,我们与滴滴出行进行了深度合作,研究问题真正来源于实际、应用于实际。在自动驾驶轨迹跟踪任务中,LipsNet相比MLP的动作震荡率降低了90.2%,极大增强了强化学习决控的动作稳定性;在MuJoCo等控制任务中也有显著改善。且LipsNet可以适用于任何Actor-Critic构架的强化学习算法,具有极强的适用性。

这篇文章最终发表在了2023年的ICML会议(CCF-A)中。这次会议在风景优美的夏威夷举办,在参会过程中,我被大数据和AI领域的快速发展深深震撼到了,更加坚定了投身大数据与AI领域的决心。值得一提的是,在夏威夷竟然遇到了当年深度学习课程的助教学长,我在与学长和全球各地学者的交流中,增长了友谊和见识,仿佛感觉我与大数据领域的纽带更深了。

宋绪杰 清华大学,大数据

图2在ICML会议中讲解海报

在会议结束后,我参加了车辆学院的博士生论坛,在“智能出行与智慧交通”分论坛中用英文汇报了论文成果,以硕士生的身份获得了分论坛的唯一一名口头报告一等奖。随后,我们还持续创新,将LipsNet应用在了扫地机器人等真实工业任务场景中,并产出一篇EI期刊论文,实现了用大数据和AI技术对工业对象赋能。

宋绪杰 清华大学,大数据

图3博士生论坛口头报告

三、勇攀高峰,挑战科学极限

在上述成果发表之后,导师与我进行了长谈,告诉我发表论文不是最终目的,并鼓励我在数据科学和AI领域做更加深刻、更有意义的研究,在芯片禁运的大背景下,要服务于国家战略、研究突破性技术方案。随后,在导师的支持下,我迈向了数据科学更加纵深和基础的领域,开始研究如何用量子计算加速神经网络的训练,希望以QPU(量子计算机)的高速计算能力破“GPU禁运之局”。

我们选择了最有可能在近些年商业化和规模化的量子计算机——伊辛机(Isingmachine),而当时鲜有在伊辛机上训练神经网络的方法,我们在研发过程中遇到了不小的困难。在科研过程中,我时常翻出深度学习课程的PPT查阅,反复细致地理解神经网络的传播结构,并尝试找到合适的训练方案。可以说,在大数据项目中学到的知识,对我每一个阶段的研究都产生了极其重大的助力。

经过不懈努力,我们发明了一种在伊辛机上训练前馈神经网络的算法——Isinglearningalgorithm,在简化版MNIST数据集中,仅需0.7秒便可完成训练,并且测试集准确率可以达到98.3%。而后,在导师的支持下,我们同时申请了中美两国专利。仅仅在论文上传arXiv的两周后,便有来自硅谷的伊辛机创业公司主动联系到我们,表达了对论文的强烈认可,以及对寻求合作的希望;此外,我们还与玻色量子等科技创业公司建立了深度合作。虽然目前的训练算法十分初级,但我认为它具有足够大的发展空间和前景,或许可成为继GPU之后的下一代训练范式。

最后,作为大数据项目的一名学生,我非常感谢有机会参与其中。作为一名硕士生,两年多短暂的科研时光转瞬即逝,我与各位博士学长相比成果并不多,但是大数据项目让我有足够的信息面对未来的科研之路,从大数据项目汲取的知识贯彻了我学习和研究的始终,可以说带领我走过了无数个人生的十字路口,真正使我受益一生!

编辑:于腾凯

校对:王欣

宋绪杰 清华大学,大数据文章来源地址https://www.toymoban.com/news/detail-834224.html

到了这里,关于宋绪杰:我的大数据成长之旅 | 提升之路系列(三)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 猿创征文|弃文从工,从小白到蚂蚁工程师,我的 Java 成长之路

    最近 CSDN 开展了猿创征文,希望博主写文章讲述自己在某个领域的技术成长历程。 之前也曾想找个机会写篇文章,记录下自己的成长历程。 因此,借着这个机会写下这篇文章。 在回顾自己的成长历程的同时,希望对一些同学的学习和工作也会有一些启发和帮助。 阅读本文,

    2024年02月16日
    浏览(43)
  • 程序猿成长之路之数据挖掘篇——朴素贝叶斯

    朴素贝叶斯是数据挖掘分类的基础,本篇文章将介绍一下朴素贝叶斯算法 以挑选西瓜为例,西瓜的色泽、瓜蒂、敲响声音、触感、脐部等特征都会影响到西瓜的好坏。那么我们怎么样可以挑选出一个好的西瓜呢? 既然挑选西瓜有多个条件可供选择,那么我们可以根据已知的

    2024年04月27日
    浏览(29)
  • [AIGC ~大数据] 深入理解Hadoop、HDFS、Hive和Spark:Java大师的大数据研究之旅

    作为一位Java大师,我始终追求着技术的边界,最近我将目光聚焦在大数据领域。在这个充满机遇和挑战的领域中,我深入研究了Hadoop、HDFS、Hive和Spark等关键技术。本篇博客将从\\\"是什么\\\"、\\\"为什么\\\"和\\\"怎么办\\\"三个角度,系统地介绍这些技术。 Hadoop Hadoop是一个开源的分布式计算

    2024年02月03日
    浏览(33)
  • 李浩然:从大数据能力提升项目出发,探索化工大数据之路 | 提升之路系列(一)...

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生

    2024年01月25日
    浏览(33)
  • 【Python成长之路】基于Flask-admin库,结合html+vue,实现前后端数据传递

    前面已经做了Flask-admin库的基本介绍和几个库常用功能如何使用,若不了解请移步到以下博客: 1、?《【Python成长之路】基于Flask-admin库,编写个人工作平台代码详述》 2、?《【Python成长之路】基于Flask-admin库,编写个人工作平台代码 -- 进阶版》 此篇文章主要是讲述: 1、结合

    2024年02月02日
    浏览(39)
  • 一年创作之旅:点滴积累,感悟成长

    一年前的此刻,我怀着对更广阔舞台的向往,将自己在博客园上的几篇精彩文章转载至CSDN平台。最初的初衷只是希望能够让更多的读者看到我的作品,期盼能为他人带来一丝帮助与启发。然而随着时间的推移,我逐渐意识到在新的平台上,我应该追寻全新的起点,并开始了自

    2024年03月27日
    浏览(44)
  • 我的大模型观:我眼中的LLM

    今年,大模型火的一塌糊涂。最近几个月paper with code上,前几名的论文几乎都是生成模型和LLM。参加AI相关的会议,也是千篇一律的LLM。国内的大厂争先恐后的发布自己的大模型,比如百度的文心、360的智脑、讯飞的星火等等,呈现出百花齐放百家争鸣的繁荣现象。。北京市

    2024年02月12日
    浏览(34)
  • 我的大模型观:我眼中的LLM和AIGC

    今年,大模型火的一塌糊涂。最近几个月paper with code上,前几名的论文几乎都是生成模型和LLM。参加AI相关的会议,也是千篇一律的LLM。国内的大厂争先恐后的发布自己的大模型,比如百度的文心、360的智脑、讯飞的星火等等,呈现出百花齐放百家争鸣的繁荣现象。。北京市

    2024年02月12日
    浏览(89)
  • Dockerfile成长之路

    随着业务架构的整改,针对非容器化业务全部进行容器化改造,这就设计到了java写的业务代码构建业务镜像,并通过k8s发版,因此,就得学习如何使用dockerfile构建后端业务镜像,可能不止构建后端代码镜像,例如前端写的代码也有可能构建为镜像。还有可能就是要在原有镜像基础上进

    2024年01月24日
    浏览(42)
  • Android程序员成长之路

    应该热爱学习Android知识 具备基本的自学能力和解决问题的能力 具备实践能力 Java(基本) C/C++(进阶) Kotlin(基本) Python(可选) 飞书学习路线图 学习路线图正在完善中... 当然读者也可以提出宝贵建议。 我将会按照 Android学习路线图 发布博客文章。 因本人才疏学浅,博客文章中难

    2024年02月09日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包