GPT-人工智能如何改变我们的编码方式

这篇具有很好参考价值的文章主要介绍了GPT-人工智能如何改变我们的编码方式。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

GPT-人工智能如何改变我们的编码方式,大模型,chatgpt,人工智能

在本文中,您将找到我对人工智能和工作的最新研究的总结(探索人工智能对生产力的影响,同时开启对长期影响的讨论),一个准实验方法的示例(通过 ChatGPT 和 Stack Overflow 进行说明,了解如何使用简单的 SQL 查询从 Stack Overflow 中提取数据。

作为与大多数技术革命一样,ChatGPT 的发布伴随着新奇和革命性的创新。一方面,在短短两个月内,该应用程序就拥有 1 亿月活跃用户,打破了历史上增长最快的消费者应用程序的记录。另一方面,高盛的一份报告声称,此类技术可能会取代全球超过 3 亿个工作岗位。此外,埃隆·马斯克 (Elon Musk) 与 1,000 多名技术领导者和研究人员签署了一封公开信,敦促暂停最先进的人工智能开发 。

“我们只能看到前方很短的距离,但我们可以看到很多需要做的事情。”艾伦·图灵

根据艾伦·图灵的引言,本文并不试图预测人工智能的遥远未来及其影响。然而,我关注的是影响我们的主要可观察后果之一:人工智能如何改变我们的编码方式。

ChatGPT 的诞生改变了世界。至少,作为一个每天都编码的人,我的世界一夜之间就改变了。我不必花几个小时在 Google 上寻找正确的解决方案,也不必在 Stack Overflow 上深入研究答案,并使用正确的变量名称和矩阵维度将解决方案转化为我的确切问题,我可以直接询问 ChatGPT。ChatGPT不仅会在眨眼之间给我答案,而且答案会适合我的具体情况(例如正确的名称、数据帧尺寸、变量类型等)。我大吃一惊,我的工作效率突然飙升。

因此,我决定探索 ChatGPT 发布的大规模影响及其对生产力以及最终对我们工作方式的潜在影响。我定义了三个假设 (Hs),并使用 Stack Overflow 数据进行了测试。

H1:ChatGPT 减少了 Stack Overflow 上提出的问题数量。如果 ChatGPT 可以在几秒钟内解决编码问题,那么我们可以预期编码社区平台上的问题会减少,因为提出问题和获得答案需要时间。

H2:ChatGPT 提高了所提问题的质量。如果 ChatGPT 被大量使用,那么 Stack Overflow 上的剩余问题必须得到更好的记录,因为 ChatGPT 可能已经有所帮助。

H3:剩下的问题更加复杂。我们可以预期剩下的问题更具挑战性,因为 ChatGPT 可能无法回答这些问题。因此,为了测试这一点,我们正在测试未回答问题的比例是否增加。此外,我还测试每个问题的浏览量是否发生变化。如果每个问题的浏览量保持稳定,这将是一个额外的迹象,表明剩余问题的复杂性增加了,并且这一发现不仅仅是由平台上的活动减少引起的。

为了测试这些假设,我将利用 Stack Overflow 上突然发布的 ChatGPT。2022 年 11 月,当 OpenAI 公开发布他们的ChatGPT时,没有其他替代品可用(例如 Google Bard),并且访问是免费的(不限于 OpenAI ChatGPT 4 或 Code Interpreter 等付费订阅)。因此,可以观察在线编码社区在震惊之前和之后的活动如何变化。然而,尽管这种冲击多么“干净”,其他影响可能会被混淆,从而质疑因果关系。特别是季节性(例如发布后的年末假期)以及问题越新,浏览量和找到答案的概率就越低。

理想情况下,为了减轻季节性等潜在混杂变量的影响并衡量因果效应,我们希望在没有 ChatGPT 发布的情况下观察世界,这是不可能的(例如因果推理的基本问题)。尽管如此,我将通过利用 ChatGPT 对编码相关问题的答案质量因一种语言而异而另一种语言不同这一事实来应对这一挑战,并使用准实验方法来限制其他因素混淆效果的风险(Difference-in -不同之处)。

为此,我将比较 Python 和 R 之间的 Stack Overflow 活动。Python 是一个显而易见的选择,因为它可以说是最
流行的编程语言之一(例如,在 TIOBE 中排名第一)
Python 的大量在线资源为 ChatGPT 等ChatGPT提供了丰富的训练集。现在,为了与 Python 进行比较,我选择了 R。Python 通常被认为是 R 的最佳替代品,而且两者都是免费的。然而,R 不太受欢迎(例如,在 TIOBE 编程社区索引中排名第 16),因此训练数据可能较小,这意味着 ChatGPT 的性能较差。证据证实了这种差异(有关该方法的更多详细信息,请参阅方法部分)。因此,R 代表了 Python 的有效反事实(它受到季节性影响,但我们可以预期 ChatGPT 的影响可以忽略不计)。

GPT-人工智能如何改变我们的编码方式,大模型,chatgpt,人工智能

图1:ChatGPT对Stack Overflow每周提问数量的影响
 

上图显示了原始的每周数据。我们可以看到,在 ChatGPT 3.5 发布后,Stack Overflow 上每周提出的有关 Python 的问题数量突然大幅下降 (21.2%),而对 R 的影响则稍小一些(下降了 15.8%)。

这些“定性”观察得到了统计模型的证实。稍后描述的计量经济学模型发现,Stack Overflow 上的 Python 每周问题平均下降了 937.7 个(95% CI:[-1232.8,-642.55 ];p 值 = 0.000),具有统计显着性。随后的分析利用 Diff-in-Diff 方法,进一步揭示了问题质量的提高(在平台上通过分数来衡量),同时未回答问题的比例也有所增加(而每个问题的平均浏览量似乎有所增加)。不变)。因此,本研究为之前定义的三个假设提供了证据。

这些发现强调了人工智能在我们工作方式中的深远作用。通过解决日常查询,生成式人工智能使个人能够将精力投入到更复杂的任务上,同时提高他们的生产力。然而,重要的长期潜在不利影响也在讨论部分进行了讨论。

本文的其余部分将介绍数据和方法,然后是结果,并以讨论结束。

数据

数据是使用Stack Overflow 数据浏览器门户上的 SQL 查询提取的(许可证:CC BY-SA)。这是使用的 SQL 命令:

SELECT Id, CreationDate, Score, ViewCount, AnswerCount
FROM Posts
WHERE Tags LIKE '%<python>%'
AND CreationDate BETWEEN '2022–10–01' AND '2023–04–30'
AND PostTypeId = 1;

然后,我按周汇总数据以减少噪音,从而获得了从 2022 年 10 月 17 日星期一到 2023 年 3 月 19 日的数据集,其中包含有关每周帖子数量、观看次数、每个问题的观看次数的信息,每个问题的平均分以及未回答问题的比例。分数由平台用户定义,他们可以投票赞成或反对,以判断问题是否显示“研究努力;它是否有用且清晰” 。

方法

为了测量因果效应,我使用了双重差分模型,这是一种计量经济学方法,通常利用随时间的变化并将处理单位与未处理组进行比较。

简而言之,Diff-in-Diff 模型计算双重差异以识别因果效应。这是一个简化的解释。首先,我们的想法是计算两个简单的差异:治疗组和未治疗组(此处分别是 Python 和 R 问题)的前(ChatGPT 发布之前)和后时期之间的“平均”差异。我们关心的是处理对处理单元的影响(这里是ChatGPT发布对Python问题的影响)。然而,如前所述,可能还有另一种影响仍然与治疗相混淆(例如季节性)。为了解决这个问题,该模型的想法是计算双重差异,以检查处理组 (Python) 的第一个差异与第二个差异(对照组 R 的差异)有何不同。

这是一个稍微更正式的表示。

参考值的第一个差异:

GPT-人工智能如何改变我们的编码方式,大模型,chatgpt,人工智能

这里的 i 和 t 分别指的是语言(R 或 Python)和周。While对待是指与Python相关的问题,Post是指ChatGPT可用的时期。这个简单的差异可能代表 ChatGPT (β) + 某些时间效应 λₜ 的因果效应(例如季节性)。

控制变量组组的第一个差异:

对照组的简单差异不包括治疗效果(因为未经治疗),而仅包括 λ。

因此,双重差分将给出:

GPT-人工智能如何改变我们的编码方式,大模型,chatgpt,人工智能

假设两组的 λ相同(平行趋势假设,如下所述),双重差异将使我们能够识别 β,即因果效应。

该模型的本质在于平行趋势假设。为了断言因果效应,我们应该相信,如果没有 ChatGPT,Stack Overflow 上 Python(已处理)和 R(未处理)帖子的演变在处理期间(2022 年 11 月之后)将是相同的。然而,这显然不可能观察到,因此无法直接测试(参见因果推理的基本问题)。然而,可以测试冲击之前的趋势是否平行,这表明对照组是一个潜在的良好“反事实”。对数据进行的两个不同的安慰剂测试表明,我们不能拒绝 ChatGPT 之前时期的平行趋势假设(测试的 p 值分别为 0.722 和 0.397(参见在线附录 B))。

正式定义:

GPT-人工智能如何改变我们的编码方式,大模型,chatgpt,人工智能

“i”和“t”分别对应 Stack Overflow 上问题的主题(i ∈ {R; Python})和周。Yᵢ 表示结果变量:问题数量 (H1)、平均问题得分 (H2) 和未回答问题的比例 (H3)。Pythonᵢ 是一个二元
变量,如果问题与 Python 相关,则取值 1,
否则取值 0(与 R 相关)。ChatGPTₜ是另一个二进制变量,
从 ChatGPT 版本及之后的版本开始,其值为 1,
否则为 0。uᵢ 是聚集在编码语言级别 (i) 的错误项

该模型的本质在于平行趋势假设。为了断言因果效应,我们应该相信,如果没有 ChatGPT,Stack Overflow 上 Python(已处理)和 R(未处理)帖子的演变在处理期间(2022 年 11 月之后)将是相同的。然而,这显然不可能观察到,因此无法直接测试(参见因果推理的基本问题)。然而,可以测试冲击之前的趋势是否平行,这表明对照组是一个很好的“反事实”。在这种情况下,两个不同的安慰剂测试表明,我们不能拒绝 ChatGPT 之前时期的平行趋势假设(测试的 p 值分别为 0.722 和 0.397(参见在线附录 B))。

结果

H1:ChatGPT 减少了 Stack Overflow 上提出的问题数量。

如简介中所述,Diff-in-Diff 模型估计 Stack Overflow 上的 Python 每周问题平均下降了 937.7 个(95% CI:[-1232.8, -642.55];p 值 = 0.000)(参见如下图2)。这意味着每周的问题数量下降了 18%。

GPT-人工智能如何改变我们的编码方式,大模型,chatgpt,人工智能

图 2:ChatGPT 对每周问题数量的影响

H2:ChatGPT 提高了所提问题的质量。

ChatGPT 可能有助于回答问题(参见 H1)。然而,当ChatGPT无法解决问题时,它可能允许人们走得更远,获得有关问题或解决方案某些要素的更多信息。该平台允许我们测试这个假设,因为如果用户认为“这个问题显示了研究成果;有用且清晰”(增加 1 分)或没有(减少 1 分)第二次回归估计问题得分平均增加 0.07 分(95% CI:[-0.0127 , 0.1518 ];p 值:0.095)(见图 3),即增加 41.2%。

GPT-人工智能如何改变我们的编码方式,大模型,chatgpt,人工智能

图 3:ChatGPT 对问题质量的影响(作者提供的图片)

H3:剩下的问题更加复杂。

现在我们有一些证据表明 ChatGPT 能够提供重要的帮助(解决问题并帮助记录其他问题),我们想确认剩下的问题更加复杂。为此,我们要考虑两件事。首先,我发现未回答问题的比例正在上升(没有答案可能表明问题更加复杂)。更准确地说,我发现未回答的问题比例增加了 2.21 个百分点(95% CI:[ 0.12, 0.30];p 值:0.039)(见图 4),这意味着增加了 6.8%。其次,我们还发现每个问题的观看次数没有变化(我们不能拒绝它没有变化的零假设,p 值为 0.477)。

GPT-人工智能如何改变我们的编码方式,大模型,chatgpt,人工智能

图4:ChatGPT对未回答问题比例的影响

讨论

这些发现支持这样一种观点,即生成式人工智能可以通过处理常规问题彻底改变我们的工作,使我们能够专注于需要专业知识的更复杂的问题,同时提高我们的生产力。文章来源地址https://www.toymoban.com/news/detail-731456.html

到了这里,关于GPT-人工智能如何改变我们的编码方式的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 人工智能与安全:如何保护我们的网络和社会

    随着人工智能技术的不断发展和进步,我们的生活、工作和社会都在不断变化。人工智能已经成为了许多行业的重要驱动力,它为我们提供了更高效、更智能的解决方案。然而,随着人工智能技术的发展,我们也面临着新的挑战和风险。这篇文章将探讨人工智能与安全的关系

    2024年01月16日
    浏览(49)
  • 人工智能的道德与安全:如何保障我们的未来

    人工智能(Artificial Intelligence, AI)是一种使用计算机程序模拟人类智能的技术。随着计算能力的提高和数据量的增加,人工智能技术的发展越来越快。然而,随着人工智能技术的发展,也引发了一系列道德和安全问题。这篇文章将探讨人工智能的道德和安全问题,以及如何保障

    2024年02月19日
    浏览(64)
  • 人工智能内心的黑暗秘密以及我们如何愚弄它

    前言 在大数据和算力的支撑下,机器学习、深度学习和强化学习成了当前人工智能的主流方向。人工智能究竟学到了什么?让它能够准确地回答人类的问题。人工智能是否具有可解释性?它是否知道自己学到的是什么?这些问题都是还未明确解决的难题。 本文继续分享《A

    2024年04月22日
    浏览(56)
  • 人工智能 AI 如何让我们的生活更加便利

    每个人都可以从新技术中获益,一想到工作或生活更为便利、简捷且拥有更多空余时间,谁会不为之高兴呢?借助人工智能,每天能够多一些空余时间,或丰富自己的业余生活,为培养日常兴趣爱好增添一点便利。从电子阅读器到智能家居,再到植物识别应用和智能室内花园

    2024年01月18日
    浏览(70)
  • 我们是如何测试人工智能的(一)基础效果篇

    这个系列算是科普文吧,尤其这第一篇可能会比较长,因为我这8年里一直在AI领域里做测试,涉及到的场景有些多, 我希望能尽量把我经历过的东西都介绍一下,算是给大家科普一下我们这些在AI领域内做测试的人,每天都在做什么事情。 当然AI领域很庞杂,我涉及到的可能

    2024年01月21日
    浏览(60)
  • 人工智能大模型 LLM 将从根本上改变软件工程吗?我们曾经嘲笑 “用嘴的速度(speed of mouth)写代码“,但现在这已成为现实。

    (来源:Blog | the scapegoat dev) 人工智能的发展已经深刻地改变了我们的生活和工作方式,使得我们能够在各种领域中实现更加复杂和高效的任务。其中包括自然语言处理(NLP)和机器翻译等领域,这些领域最近出现了一种新的技术——基于大型语言模型的自适应技术,也称为

    2024年02月07日
    浏览(51)
  • 人工智能如何改变物流模式:探讨智能物流技术在配送中的应用

    作者:禅与计算机程序设计艺术 人工智能如何改变物流模式:探讨智能物流技术在配送中的应用 随着人工智能技术的飞速发展,智能物流逐渐成为人们关注的焦点。智能物流是指在物流系统中,利用人工智能技术,对物流过程进行优化、升级和改造,以提高物流效率和降低

    2024年02月07日
    浏览(74)
  • 人工智能时代,普通的我们如何提升自己的核心竞争力

    今天这篇文章,麒麟子不聊技术,想聊聊大家都在关心的问题: 人工智能时代,普通的我们如何提升自己的核心竞争力。 看着社区的开发者们都在讨论 ChatGPT,麒麟子也试用了一下,已经成功让它参与到了下面的工作: 写出直接复制到 Cocos Creator 就能用的 Cocos Shader 润色 C

    2023年04月11日
    浏览(50)
  • 【深度思考】人工智能技术对未来各行业的影响,我们该如何应对?

    目录 1、AI的应用对行业带来的机遇 2、AI将冲击哪些行业 3、如何应对AI对个人发展的挑战          4、AI对于程序员的冲击 随着技术的不断发展,AI已经开始深刻影响着各行各业。从生产制造到金融、医疗和交通等行业,人工智能技术都在发挥着越来越重要的作用。现在让我

    2024年02月09日
    浏览(59)
  • 从“手写病例”到“AI家庭医生”,人工智能大数据如何走进我们的生活?

    编 辑:老彭 来 源:大数据架构师 彭友们好,我是老彭。最近“X疾病”肆虐,彭友们要小心啊,一定要保重身体。老彭去年就老去医院,不知道是不是“X疾病”闹的 。 上周末我特意找国家卫健委沈剑峰沈博士请教,顺便叙叙旧,他给我们讲了很多很有意思的医学新进展。

    2024年04月09日
    浏览(124)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包