摘要:假设学生将使用人工智能和大型语言模型(例如Chatgpt)来完成作业,研究人员着手学习免费版本的Chatgpt的免费版本与人类学生在一个学期的本科控制系统课程中进行比较。...
假设学生将使用人工智能和大型语言模型(例如ChatGpt)来完成作业,伊利诺伊州Urbana-Champaign Grainger工程学院的航空航天工程系的研究人员开始学习免费版本的免费版本与人类学生相比,一个学期的学生与人类的学生相比如何。
结果:在直接的数学作业中,Chatgpt有一个A,但有一些古怪的答案。但是,在需要推理的高级问题上,它得到了D。
“我们发现ChatGpt技术可以在结构化的,直接的问题上获得A。在开放式问题上,它获得了62,Brining Chatgpt的学期成绩降至82,低B,低B。人类学生的班级平均水平为84.85%,因为他们可以处理需要高级推理的问题。”学生Gokul Puthumanaillam。
该研究得出的结论是,一位付出最少努力的学生没有表现出任何学习材料的努力,可以专门使用Chatgpt,获得B并通过课程。问题是传递等级可能是A+在简单数学和D-中的组合。他们没有学到太多。
Puthumanaillam的顾问Melkior Ornik说:“就像数学课上的计算器一样,Chatgpt是一个可以留在这里的工具,学生将使用。这项研究的结果向我指出的是,我需要作为教育工作者进行调整。” “我计划考虑如何设计课程,以便随着时间的流逝,我还包括更多的更高层次的问题,可能包括基于项目的任务。学生仍然会使用诸如Chatgpt之类的程序来解决更简单的数学问题,但是通过添加更多的开放性问题,他们还将达到更高的批判性思维水平,并真正学习材料。”
Puthumanaillam说,尽管Chatgpt快速且大多在结构化问题上是正确的,但明智的谨慎使用它是明智的。
“学生可能需要20分钟才能回答一个问题。Chatgpt在不到20秒的时间内解决了问题,但有时可以质疑正确性。”
他还描述了Chatgpt作业中奇怪行为的例子,例如使用不适当的技术术语并说出根本不正确的事情。
“尽管我们提供了Chatgpt所需的所有课程材料,但它仍然使用了诸如班级中从未在课堂上,讲座或课程材料中从未使用过的Quasi定期振荡的词来进行幻觉。”
该研究考虑了选择最少努力的学生类型。 Puthumanaillam表示,Chatgpt的高级版本可能更有能力解决分析问题,并且可以存储更多的记忆以解决更长,更复杂的问题。研究人员选择使用该软件的免费版本,因为普通学生可能不想花每月费用。
Puthumanaillam指出,课程中没有团队任务,Chatgpt提示使用了人类学生收到的确切语言,并且都同步进行。
“当学生做作业时,Chatgpt也在做作业。Chatgpt只是班上的额外学生。”
Chatgpt是否从错误中学习?
“当我们告诉chatgpt在一个多项选择的问题上是错误的,给了它正确的选择,然后给出了相同问题的变化,是的,它做得更好。从某种意义上说,它是在学习,但这是停滞不前的。如果它在家庭作业中得分90%,最终在学期结束时得分为90或92。”
这项工作得到了伊利诺伊大学Urbana-Champaign大学Grainger工程学院的工程教学课程教学课程的赠款的支持。航空航天教授蒂姆·布雷特尔(Tim Bretl)以及博士学位学生Grayson Schaer和Pranay Thangeda,创建了项目环境,开发了课程材料和大草原基础设施。