首页 >> 今日更新 >

研究发现 52% 的 ChatGPT 编程问题回答错误

2024-05-24 11:00:26 来源: 用户: 

相信很多大家对研究发现 52% 的 ChatGPT 编程问题回答错误还不知道吧,今天菲菲就带你们一起去了解一下~.~!

5月24日 消息:在过去的几年里,计算机程序员纷纷转向诸如 OpenAI 的 ChatGPT 之类的聊天机器人来帮助他们编码,这对 Stack Overflow 等网站造成了打击,导致其去年不得不裁员近30% 的员工。然而,问题在于,普度大学的研究团队在计算机 - 人类交互会议上发布了研究成果,发现 ChatGPT 生成的编程问题答案中有52% 是错误的。

图源备注:图片由AI生成,图片授权服务商Midjourney

对于一个人们依赖于准确性和精确性的程序来说,这一比例是惊人的,这也突显出其他最终用户如作家和教师所经历的问题:像 ChatGPT 这样的 AI 平台经常在空中凭空产生完全错误的答案。研究人员在研究中回顾了517个 Stack Overflow 的问题,并分析了 ChatGPT 尝试回答这些问题的结果。他们写道:“我们发现52% 的 ChatGPT 答案包含错误信息,77% 的答案比人类答案更冗长,78% 的答案与人类答案存在不同程度的不一致”。

该团队还对随机选择的2000个 ChatGPT 答案进行了语言分析,发现这些答案 “更正式和分析性更强”,同时表现出 “更少的负面情绪” —— 这是 AI 倾向于产生的单调而愉快的语气。尤其令人担忧的是,许多人类程序员似乎更喜欢 ChatGPT 的答案。普度大学的研究人员对12名程序员进行了调查,并发现他们以35% 的比例更倾向于选择 ChatGPT,并且在39% 的情况下没有发现 AI 生成的错误。

为什么会发生这种情况呢?这可能只是因为 ChatGPT 比在线人更有礼貌。研究人员写道:“后续的半结构化访谈揭示出,礼貌的语言、文雅而教科书般的回答方式以及全面性是 ChatGPT 答案看起来更具说服力的主要原因之一,因此参与者放低了警惕,忽略了 ChatGPT 答案中的一些错误信息”。

这项研究表明,ChatGPT 仍然存在重大缺陷,但这对于被 Stack Overflow 裁员的人或者不得不纠正 AI 生成的代码错误的程序员来说是一个苦涩的安慰。

以上就是关于【研究发现 52% 的 ChatGPT 编程问题回答错误】的相关内容,希望对大家有帮助!

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章
  • 【空谷幽兰是什么意思】“空谷幽兰”是一个富有诗意的成语,常用来形容在偏僻、冷清的地方生长的兰花。它不仅...浏览全文>>
  • 【空格怎么打出来】在日常使用电脑或手机输入文字时,经常会遇到需要输入“空格”的情况。虽然看似简单,但很...浏览全文>>
  • 【空格怎么打】在日常使用电脑或手机时,很多人会遇到“空格怎么打”的问题。其实,“空格”是一个非常基础的...浏览全文>>
  • 【空格名字怎么打】在日常使用电脑或手机时,很多人会遇到“空格名字怎么打”的问题。尤其是在输入法设置、文...浏览全文>>
  • 【空格键是指的哪一个】在日常使用电脑或手机的过程中,我们经常接触到各种按键,其中“空格键”是一个非常基...浏览全文>>
  • 【空挡是什么意思】“空挡”是一个在多个领域中常见的术语,尤其在汽车驾驶、机械操作以及一些比喻性表达中使...浏览全文>>
  • 【空城旧梦是情侣网名吗】“空城旧梦”这个词语,听起来充满了诗意和情感色彩。它常被用于表达一种孤独、怀念...浏览全文>>
  • 【可吸收线是什么颜色】在医学领域,尤其是外科手术中,可吸收线是一种常见的缝合材料。它主要用于缝合伤口,...浏览全文>>
  • 【可为是什么意思】“可为”一词源自中文,常用于表达“可以做”、“值得做”或“有作为”的含义。在不同语境...浏览全文>>
  • 【可微与可导之间有什么联系】在微积分的学习过程中,“可导”和“可微”是两个经常被提到的概念,它们看似相...浏览全文>>