GitHub 2800颗星,支持GPT/Transformer,字节跳动这个开源项目是怎么来的?

这篇具有很好参考价值的文章主要介绍了GitHub 2800颗星,支持GPT/Transformer,字节跳动这个开源项目是怎么来的?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

AI 绘画、机器翻译、多轮对话……对于各类 AI 相关的功能来说,总有一个痛点,困扰着所有训模型的算法工程师们:

想要效果更好,那么 AI 模型一般都很大,耗费的算力更多不说,运行起来还更费时间;

如果希望模型小、运行快,那么效果通常不如前者好。

这就像天平的两端,算法工程师们常常需要根据不同场景和限定条件,在跑得快和效果好之间取得一个平衡。

因此,如果有一项技术可以在两者之间做好平衡,那么,它大概率会成为对业界有贡献的重要技术。

LightSeq 就是这样一项技术。

具体来说,LightSeq 是一个模型训练推理引擎,就像一个炼丹炉,Transformer/GPT/BERT 这种以体积大、效果好、但运行更耗时的 AI 模型都可以扔进去炼一炼,帮助它们提速。

而且 LightSeq 不仅可以在模型训练环节提速,让开发者更便捷的使用;也可以在推理环节提升运行速度,让各类 AI 模型更快地产出效果,降低 AI 翻译、AI 生成文字等任务的耗时,更好地服务用户。

自 2019 年开源以来,LightSeq 受到了很多机器学习从业者的欢迎,在 GitHub 上已经收获了超过 2800 颗星。

GitHub 2800颗星,支持GPT/Transformer,字节跳动这个开源项目是怎么来的?

在做 LightSeq 之前,一个关于模型运行速度的问题一直让 ByteDance Research 团队的王辉感到困扰:

2019 年,机器翻译行业出现了一轮技术迭代,大家正在由 LSTM 模型切换到更新的 Transformer 模型,以实现更好的翻译效果。

但是,当时效果最好的 Transformer 翻译一句话,要耗费长达 1 秒钟的时间,这将大大影响用户体验。

于是王辉拉着几位同学,开始研究 GPU 模型加速,从头进行 CUDA 编程,开始了 LightSeq 的研发过程。

在学习了大量的底层技术知识、进行了不少优化研发后,LightSeq 第一版问世了。他们首先在字节跳动的火山翻译业务上运用,果然取得了不错的效果,翻译速度大大提升。

2019 年底,LightSeq 研发团队将它回馈给了开源社区,并持续保持版本迭代,帮助其他开发者一起提效。

GitHub 2800颗星,支持GPT/Transformer,字节跳动这个开源项目是怎么来的?

开源成果受到欢迎,LightSeq 论文也同时获得了学术界的认可。

LightSeq 的推理引擎论文中选了 NLP 领域顶会 NAACL 2021。

GitHub 2800颗星,支持GPT/Transformer,字节跳动这个开源项目是怎么来的?

第二年 LightSeq 的训练系统论文也被超算领域国际顶会 SC22 接收。

GitHub 2800颗星,支持GPT/Transformer,字节跳动这个开源项目是怎么来的?

王辉最近还在北京大学软件和微电子学院开设了一个学期的研究生课程,专门给北大的学生们介绍 AI 领域的进展,教他们 LightSeq 的使用方法。

获得外部认可的同时,LightSeq 研发团队也在积极将它落地在字节跳动的 NLP 业务场景。除了机器翻译,例如广告文案生成、电商内容理解也能借助 LightSeq 大规模提升模型训练和推理的速度。

团队甚至还将 LightSeq 部署在了移动端,即使你的手机没连网,也能仅使用手机 CPU 的算力实现 AI 自动翻译。

他们还为此写了一篇论文《MobileNMT: Enabling Translation in 15MB and 30ms》,这篇论文也已经中选了自然语言处理顶会 ACL 2023 的 Industry Track。

GitHub 2800颗星,支持GPT/Transformer,字节跳动这个开源项目是怎么来的?

LightSeq 团队希望不断追逐最前沿的技术,让技术回馈业界,用创新服务用户。来听听他们是如何探索新技术的吧。

GitHub 2800颗星,字节跳动这个开源项目是怎么做出来的?

最后,照例给大家送上 LightSeq 项目相关地址,欢迎各位开发者一起探索~

GitHub:

https://github.com/bytedance/lightseq

LightSeq 论文:

https://arxiv.org/abs/2010.13887

LightSeq2 论文:

https://arxiv.org/abs/2110.05722

MobileNMT 论文:

https://arxiv.org/abs/2306.04235

 文章来源地址https://www.toymoban.com/news/detail-493947.html

到了这里,关于GitHub 2800颗星,支持GPT/Transformer,字节跳动这个开源项目是怎么来的?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 12-SpringSecurity:通过OAuth2集成Github登录,字节跳动网络工程师的面试

    (1) 注册应用 在Github注册一个应用,生成 client-id , client-secret 。 注意这里的Home页: http://localhost:8080 ,以及回调地址: http://localhost:8080/login/oauth2/code/github (2) 配置 application.yml spring: security: oauth2: client: registration: github: client-id: client-secret: (3) 启动应用 为了看到登录

    2024年04月10日
    浏览(34)
  • 字节跳动推出的 AI 工具:Coze,无需编程基础,快速创建 AI Chat Bot,功能堪比 GPT4.0

    今天给大家介绍一款由字节跳动公司推出的人工智能工具:Coze。它是一个应用编辑平台,用于开发新一代 AI Chat Bot,无需编程基础,就可以快速创建各种类型的 Chat Bot,并将其发布到各类社交平台和通讯软件上。据说该工具提供了免费的 ChatGPT3.5 和 GPT4 的功能,其功能可与

    2024年02月04日
    浏览(86)
  • 字节跳动开源!超好用的视频抠图工具;GitHub开源项目维护协作指南;自动化数据清洗工具包;强化学习入门教程;前沿论文 | ShowMeAI资讯日报

    👀 日报合辑 | 📆 电子月刊 | 🔔 公众号下载资料 | 🍩 @韩信子 https://github.com/HelixNGC7293/DeforumStableDiffusionLocal https://space.bilibili.com/176003 文本提示作画工具。本代码库实现是本地版本的Deforum Stable Diffusion V0.4,支持txt设置文件输入和动画功能! https://github.com/PeterL1n/RobustVideoMat

    2023年04月08日
    浏览(27)
  • 字节跳动春招——特征提取

           小明是一名算法工程师,同时也是一名铲屎官。某天,他突发奇想,想从猫咪的视频里挖掘一些猫咪的运动信息。为了提取运动信息,他需要从视频的每一帧提取“猫咪特征”。一个猫咪特征是一个两维的vectorx, y。如果x_1=x_2 and y_1=y_2,那么这俩是同一个特征。    

    2024年02月07日
    浏览(27)
  • 字节跳动高频题目(1)

     3,1,42,200,15 121,128,49,25,88 5,146,70,2,4 21,33,55,27,560 11,20,31,53,236 300,26,215,279,438 135,148,9,169,76 22,101,14,54,56 72,206,152,80,39 46,62,104,122,179 3. Longest Substring Without Repeating Characters Medium Given a string  s , find the length of the  longest   s

    2024年04月28日
    浏览(26)
  • 字节跳动懂车帝一面

    自我介绍 3分钟 项目介绍 10分钟 完单率解释 广告计费和消耗 AB实验一般怎么做? 常见AB策略有哪些类型? 进行AB的策略是如何寻找? 决定要不要AB,通常是有新的能力/产品上线,预计对业务的核心关注指标有收益,需要用实验证明有收益可扩量 AB怎么分组,以及各自多少流

    2024年02月08日
    浏览(32)
  • 【2023】字节跳动 10 日心动计划——导航

    关于该专题的刷题已整理完毕,以下是内容导航。 第一关:单词替换、二叉树最大高度 第二关:最小体力消耗路径、缺失的第一个正数 第三关:最长有效括号、有序数组的平方 第四关:买卖股票的最佳时机、打家劫舍 II 第五关:字符串的排列、和为 K 的子数组 第六关:环

    2024年02月12日
    浏览(27)
  • 字节小程序踩坑-uni-app字节跳动小程序运行

    运行-运行到小程序模拟器-运行设置 运行-运行到小程序模拟器-字节跳动开发者工具  注意:抖音小程序不会像微信小程序自动打开!!!! 复制提示的地址 手动打开抖音小程序 点击导入项目,把地址复制到项目目录,点击导入即可 现在修改改HBuilderX的内容并运行,抖音小

    2024年02月14日
    浏览(33)
  • 薪资25k,我从字节跳动离职了...

    这个决定已经在我心头很久了,直到最近字节上热搜,我离职了... 我还是鼓起了勇气写了这篇文章,也算是找到了新目标,有了重新出发的勇气 18 年毕业加入滴滴,之后跳槽到了字节,一直从事软件测试的工作。之前没有实习经历 毕业4年多,测试岗,之前在许多中小公司

    2024年02月09日
    浏览(25)
  • 分享一道字节跳动后端面试算法题

    题目: 给你一个字符串s,可以将任意一个字符转为任意一个小写字符,这个操作可有m次,问转化后的字符串中最长的相等子串长度。 案例: s=\\\"abcdac\\\" ,m=2,2次操作,可以转化为\\\"abcccc\\\" ,最长是4,返回4。 分析: 题目很好理解,但是如果对算法掌握不是很透彻或者是对滑动

    2024年02月16日
    浏览(28)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包