AI也难逃老年痴呆风波?研究称随着年龄增长,AI版本越来越糊涂
AI也难逃老年痴呆风波?研究揭示:随着年龄增长,AI会变得越来越健忘
数界探索
12月20日消息,近日,有报道称,以色列特拉维夫大学的一项研究发现,AI已经出现了数字痴呆症的现象。
在这项研究中,科学家测试了几乎所有的全球顶级AI大型语言模型,结果发现它们都表现出类似早期老年痴呆的认知障碍,而且模型版本越旧,表现就越差。
为了评估实验效果,科学家们采用了蒙特利尔认知评估量表,这一量表常用于检测老年痴呆症。此次测试对象涵盖了多个公开的大型语言模型,包括ChatGPT的不同版本以及Gemini的最新和旧版本。根据设定,该测试的满分是30分,而26分或以上被视为正常水平。 蒙特利尔认知评估量表作为一种标准工具,在这次测试中的应用显得十分恰当。它不仅能够提供一个客观的衡量标准,还能够帮助我们更好地理解这些先进的语言模型在模拟人类认知能力方面的表现。值得注意的是,尽管这些模型在某些方面已经取得了显著的进步,但它们与真正的人类大脑之间仍然存在明显的差距。这样的研究有助于我们更清晰地认识人工智能技术当前的发展阶段,并为未来的研究方向提供了宝贵的参考。
实验结果显示,只有GPT-4o在测试中获得了最高分26分,其次是GPT-4是25分,Gemini 1.0仅得16分。
研究结果显示,几乎所有的模型在视觉空间能力和执行任务方面表现欠佳,难以展现出同理心或准确解读复杂的视觉场景。 这一发现揭示了当前人工智能技术在处理复杂视觉信息时存在的局限性。尽管近年来AI在许多领域取得了显著进展,但其在理解和解释人类情感以及复杂环境方面的能力仍显不足。这不仅限制了AI在医疗诊断、自动驾驶等关键领域的应用潜力,也提示我们需要进一步探索如何提升AI的情感智能与感知能力,以实现更广泛且深入的应用。
科学家指出,所有大型语言模型在涉及视觉抽象和执行功能的任务中均表现不佳,这突显了其在临床环境中应用的一大潜在短板。因此,他们得出结论,这些具有数字痴呆倾向的AI系统短期内无法取代医生的角色。