
纽约大学的一名教授用人工智能主持了一场考试,在注意到学生“可疑”作业的趋势后,他选择了“以毒攻毒”。
随着人工智能越来越普遍,它正在挑战教育的基础。对于许多当前的学生来说,人工智能程序已经成为一种依赖,依靠ChatGPT这样的工具来帮助,或者在某些情况下,直接处理整个作业。
这种趋势正是NYU商学院教授Panos Ipeirotis希望在2025年底应对的。数据科学家开始注意到一些任务“好得可疑”正如他所描述的,这不仅对一个“强壮的学生”来说是好的,而且是非常优秀的。
因此,为了扭转局面,真正测试他的学生的知识,他自己向AI寻求帮助。Ipeirotis在人工智能的帮助下进行了一次考试,让他的学生直接与人工智能聊天机器人交谈,以推断他们的专业知识。
在开始怀疑学生使用人工智能后,教授开始“在课堂上随机给学生打电话。”尽管许多人在评估中提交了“深思熟虑、结构良好的工作”,但一些人在仔细审查下难以解释“基本选择”。
Ipeirotis在博客中写道:“学生现在可以立即使用LLM,它可以处理我们传统上用于评估的大多数考试问题。”"突然之间,一个学生可以就一个他们几乎没有接触过的项目发表一篇精致、复杂的演讲."
这导致教授进行口试,学生在没有教科书帮助的情况下说话,或者在今天的时代,人工智能程序帮助说话。Ipeirotis解释说:“它们迫使人们进行实时推理,应用于新颖的提示,并为实际决策辩护。”。
使用ElevenLabs对话式人工智能,教授从头开始构建了一个“考官”来测试他的学生。这个人工智能机器人将使用学生姓名和项目细节,为所有36名参与者进行个性化评估。
学生与人工智能模型交谈,回答各种案例研究的问题,平均需要25分钟。
从那里,三个不同的人工智能程序被用来检查对话的记录,甚至给学生打分。最短的考试只花了9分钟,却提供了最高的成绩19/20。
最终,根据Ipeirotis的说法,这些人工智能程序给出的反馈“比任何人产生的都好”。然而,学生们发现压力更大,57%的人希望回到传统的笔试。
绝大多数人同意,与人工智能程序的对话彻底测试了他们对课程材料的理解。最后,教授说:“这个概念是可行的。执行需要迭代。”