全球首个“AI程序员”Deven诞生,真的能替代人类程序员吗?

这篇具有很好参考价值的文章主要介绍了全球首个“AI程序员”Deven诞生,真的能替代人类程序员吗?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

制造Devin的公司,是一家叫Cognition的10人初创公司,才成立不到2个月。

一、引言

一家成立不到两个月但拥有十名天才工程师的初创公司Cognition,搞了一个引爆科技圈的大动作。

他们推出了一款名为Devin的人工智能(AI)助手,可以协助人类软件工程师完成诸多开发任务。Devin不同于现有其他AI助手(GitHub Copilot 等 AI 编程助手),它并非单纯辅助的角色,而是能够完全独立、端到端地完成整个开发项目,包括从编写代码、修复 Bug 到最终执行的完整编程生命周期。

这是第一个真正意义上完全自主的AI软件工程师,一亮相即掀起轩然大波,因为人们担心:人类程序员是不是真要失业了?

二、Deven能力及特点

测试表现超过同辈

在 SWE-bench 基准测试(评估大模型解决 GitHub 真实问题的能力)中发现,Devin 在人类未协助时达到了 13.86% 的正确率,超过了 Claude 2(4.80%)、Llama、GPT-4(1.74%,此前的测试结果是 0%)。更重要的是,Devin在测试中没有得到任何帮助,而其他所有模型都需要帮助,即人们要准确告知模型需要编辑哪些文件。

devin很厉害吗,知识分享,人工智能

这一进展,标志着AI在自主理解和解决软件开发问题方面取得了显著进步。目前,Devin已经成功通过一家AI公司面试,并且在Upwork上完成了实际工作。资深程序员在试用过Devin之后认为,它已经不仅仅是一个编程助手,简直是一个可以独立工作的员工。它可以从零构建网站、自行部署应用、学习新技术等,人类只需扮演一个下指令和监督的角色。

运作几乎完全自主

Devin的厉害之处,还在于可以规划和执行异常复杂的工程任务,这类任务通常需要数千个决策才能完成。在这之中,无论进行到任何一步,它都可以回调所有相关的上下文信息,保证任务的逻辑性,也便于随时校正。

更让人震撼的是,Devin不仅能帮人们解决代码,还囊括了与之相关的整个工作流。

譬如,当工程师需要设计一个网页游戏时,Devin首先能生成网页,接着还能完成服务端的部署,最后直接发布上线,省去了中间大量人工操作。甚至在发现漏洞之后,Devin还会回溯报错出现的位置及对应的数据,然后分析原因并给出解决方案。

此外,作为一个AI全能助手,Devin还可以帮助人类训练和微调其他AI。对于一些常见的模型,你只需要提及模型的名称,Devin自己就知道要怎样去训练。

那人们需要做什么呢?按设想,最终的Devin会让人类只需要发号施令,其他什么也不用做。

它有哪些能力?

Devin 的主要特性有:

  • 能学习使用陌生的技术。仅仅是读完一篇博客,就可以用 ControlNet 生成带有隐藏信息的图片。

  • 端到端构建和部署应用。Devin 创建了一个模拟“生命游戏”的互动网站,它根据用户的需求逐步增加功能,然后将应用部署到 Netlify 上。

  • 自主查找并修复代码库中的错误。

  • 能训练并微调自己的 AI 模型,而这仅仅只需要一个 GitHub 研究库的链接。

  • 能处理开源仓库中的 Bug 和功能请求。

  • 能为开源项目做真正的贡献,修复 Bug、提交 PR。

Deven竟是由十人小公司开发?

Devin 背后的公司 Cognition AI ,该公司成立不到2个月,核心创始团队为3名华人由:Scott Wu(首席执行官)、Steven Hao(首席技术官)和 Walden Yan(首席产品官)组成,都是很早学编程的年轻新生代。Cognition的创始成员均曾在Scale AI 、Google 、DeepMind、Waymo等公司从事过AI前沿工作。

颇为吸睛的是,初创公司Cognition虽然只有十名员工,但他们手中却握着十块IOI(国际信息学奥林匹克竞赛)金牌。IOI 是国际信息学奥林匹克竞赛,基本是国内清北保送、天才少年的所在。

三、实际体验

Devin到底是一个漂亮的Demo,还是一个已经能替代程序员的智能体,使用体验怎么,拿到测试资格的网友第一时间分享了自己的体验。

在演示中,Devin几乎已经可以独立完成很多人类程序员需要大量时间才能完成的工作,效果一点不比普通程序员差。

但是,产品能力的边界在哪里,实际体验和演示时候有差距,还的看上手实测之后的效果。

一位斯坦福的小哥在Devin发布的第一时间就联系了团队,获得了第一手体验的资格。
devin很厉害吗,知识分享,人工智能
他让Devin帮它做了几个难度不一的项目,录制了一个视频,在推上写下了自己的使用感受。

首先是让Devin做一个用API获取股票价格的软件,下一个任务是让Devin做一个可以让普通用户直接与大模型下棋的网站。

最终,小哥初步总结了用Devin开发的第一个网站的使用体验。

先说优点:

  • Devin产品化做得很好,他给人的使用体验是一个完整的产品而不是只是一个简单的对话框。

  • AI是系统最关键的部分,但支撑AI功能的产品化的结构是Devin的亮点。

  • Devin能够完成自动部署,API密钥保护,随时修改和添加需求等等非常好的各种功能。

  • 产品的完成度已经非常高了,远远超过了一般的演示Demo。

再说缺点:

  • Devin的反应还很慢,当然小哥也说,因为他用的是1M的Starlink来上网,所以反应慢很有可能是他自己的原因。

  • 其次就是还不能允许用户直接自己编辑代码,而且也没法协作完成。

  • 当然,最初那个下棋的应用,难住了Devin,最终没有完成部署。而那个数据可视化的任务,似乎也有些Bug。

网友看了这个实测之后还是感觉有点失望,毕竟这个任务一个初级程序员是能做到的,但是Devin的可视化项目的结果只做出了一个有Bug的网页。看样子Devin本质上还只是一个可以上网的大模型,现在要让他解决实际问题还有难度。
devin很厉害吗,知识分享,人工智能

关于这里小哥具体的体验过程,参看:Devin第一手体验:开始编码就停不下来,但要替代程序员还很远

四、通过了面试,但不一定适合职场

首个AI程序员,已经实现了突破,目前的实际体验也许没有那么的优秀,但是再经过一段时间的发展,也许数十年后,上述问题都能得到解决,等到发展的相当成熟的时候,我们也不得不思考一个问题:它真的适合职场吗?

对于Deven是否适合职场,这是一个复杂且多角度的问题。从纯技术的角度来看,发展完善的Deven无疑展现出更强大的编程能力,能够快速、准确地完成编程任务。这使得它在某些特定的、高度技术化的职场环境中,可能表现出色。

然而,职场不仅仅是技术的竞技场,它更是一个涉及人际关系、团队协作、情感沟通等多方面因素的复杂系统。在这些方面,AI程序员如Deven目前还存在明显的局限性。它无法像人类一样进行深入的交流和沟通,无法理解和感受他人的情感和需求,因此在团队协作和人际关系处理上可能存在困难。

此外,职场中的很多决策并不仅仅基于技术因素,还涉及到战略、文化、价值观等多个方面的考量。这些都需要具备丰富经验和深厚洞察力的人类来做出判断。在这方面,AI程序员如Deven可能还无法完全替代人类。

因此,虽然Deven在技术上表现出色,但要说它完全适合职场可能还为时过早。毕竟,一个真正优秀的程序员不仅需要高超的技术能力,还需要具备良好的人际交往、团队协作和情感沟通能力。未来,随着AI技术的不断发展和完善,我们或许可以期待AI程序员在更多方面展现出其优势,但同时也需要认识到其局限性和挑战。在职场中,人类和AI的协作与互补可能将是一个更为现实和可行的方向。

五、结束语

此前面对 GPT 编程时,在《新程序员 007:大模型时代的开发者》中,我们提到,GPT 的编程能力我们需要有着很大的敬畏,但彼时,GPT 并不能独立解决完整的真实编程任务。

而现在,Cognition AI 这家此前从未听闻的公司,一群年轻人,创造了这样一款产品,让 AI 编程实现了一个巨大的飞跃。同济大学特聘教授朱少民表示,“看完 Devin 让我很是震撼,AI 编程比我们预想得要快,只会写代码的程序员下岗的可能性越来越大。”

自主编码智能体Devin已现AGI雏形!它能在几分钟内自主编写整个应用程序。这是真正无代码未来的开始。

因此,尽管Deven在技术上取得了令人瞩目的成就,但我们也不能盲目地认为它就是职场的完美选择。在未来的发展中,我们或许可以期待AI在编程领域取得更大的突破,但同时也需要关注它在职场中的适应性和局限性。文章来源地址https://www.toymoban.com/news/detail-843575.html

到了这里,关于全球首个“AI程序员”Deven诞生,真的能替代人类程序员吗?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 首个AI程序员诞生!已通过公司面试,掌握全栈技能,可独自开发完整项目

    3 月 13 日,由华人团队创立的 Cognition Labs 推出了第一个 AI 软件工程师 Devin,从目前公布的信息来看,说它是目前最强的 AI 软件工程师似乎一点也不过分,今天直接在 X 上刷屏。 在 SWE-Bench 基础测试中,无需人类协助,Devin 就可以解决 13.86% 的问题。而目前的 SOTA 模型,在没

    2024年04月11日
    浏览(50)
  • 【话题】首位AI程序员诞生了,你怎么看?

           全球首位AI程序员的诞生确实引起了人们对于程序员职业未来的担忧。AI程序员能够自动化完成代码编写、测试以及部分问题的排查工作,极大地提高了软件开发效率和速度。它们还可以提供优化算法和代码改善的建议,降低了软件开发的成本和错误率。        AI程

    2024年04月09日
    浏览(38)
  • 程序员饭碗不保?首个 AI 程序员 “Devin”:从编码辅助到独立完成项目

    昨天一家名为 CognitionAI 的公司,发布了首个 AI 程序员 “Devin” 🌟 CognitionAI 官网提供了多个 Devin 的实际操作视频实例,主要包括: 通过阅读博客,Devin 可以学习如何使用不熟悉的技术(如在 Modal 上运行 ControlNet,Modal 是一个 serverless 平台)。 让 Devin 创建一个个人网站来模

    2024年03月16日
    浏览(45)
  • 世界首个AI程序员Devin让工程师急了?

    近期,全球首位AI程序员Devin的出场,不禁让我想到了一个有趣的问题:AI程序员会不会抢程序员的饭碗呢?先别着急下结论!虽然AI技术在编程领域越来越广泛,但它真的能完全替代我们程序员吗? Devin是一家名为Cognition的公司开发的超级智能计算机程序。它就像一个非常聪

    2024年04月11日
    浏览(44)
  • 全球首位AI程序员Devin的出场,程序员饭碗不保?

    近期,全球首位AI程序员Devin的出场,不禁让我想到了一个有趣的问题:AI程序员会不会抢程序员的饭碗呢?先别着急下结论!虽然AI技术在编程领域越来越广泛,但它真的能完全替代我们程序员吗? AI程序员的优势在于他们具备深厚的数学和编程能力,熟悉各种机器学习和深

    2024年04月11日
    浏览(49)
  • 阿里全面使用通义灵码AI写代码了,程序员真的是个憨憨,自己把自己干没了

    今天看到一篇文章,原文链接戳这里:《我们团队来了一位新同事,主动要求帮忙敲代码!欢迎 AI 001号》 文章大意是:阿里云内部全面推行 AI 编程,未来 20% 代码由通义灵码编写,阿里云正在其内部推广 AI 编程,其中 AI 通义灵码已分配员工工号 AI001,并计划未来 20% 的代码

    2024年04月29日
    浏览(38)
  • ChatGPT真的会取代程序员吗?

    程序员这两年被碰的瓷儿可不少啊,这架势不像是AI抢了程序员的饭碗,倒像是程序员抢了AI的饭碗一样...... 前两年低代码出来了,你们说程序员要被取代了,惹得大神们一顿输出; 去年元宇宙出来了,你们又说程序员要被取代了,惹得大神们又一顿输出; 今年chatgpt出来了

    2023年04月09日
    浏览(41)
  • ChatGPT真的能替代程序员吗?

    1. ChatGPT是什么? ChatGPT是一种基于人工智能和自然语言处理技术的对话生成模型,其可以实现自动生成对话内容的能力。它的出现可以解决许多文本自动生成任务,也被用于许多AI应用程序中。 2. ChatGPT是否能替代程序员? ChatGPT目前的技术发展尚未达到完全替代程序员的程度

    2024年02月04日
    浏览(38)
  • 程序员职业生涯真的很短吗?

    毕业后,我顺利找到了一份程序员的工作,开始了我的职业生涯。那个时候我仍然没有太多的认识,只是觉得程序员老是在敲代码、写文档、开会,很累很辛苦。但是我还是很喜欢我的工作,因为我觉得写出来的代码是一个一个小成就,能够带给用户实际的使用价值。 过了几

    2024年02月05日
    浏览(107)
  • 8个全球性编程比赛,天才程序员的梦想舞台

    很多编程爱好者在学习之初,都渴望与全球的程序员一较高下,以证明自己的实力。 一些全球性的编程竞赛为他们提供了这样的机会,不仅可以与全世界的顶尖程序员们交流,还有机会获得丰厚的奖金和进入顶级公司的机会,更重要的,在这样的舞台上可以尽情展示自己的才

    2023年04月11日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包