《英国医学杂志》最新发表的一项研究显示,在广泛用于检测阿尔茨海默病早期症状的测试中,大部分参与测试的人工智能大语言模型都表现出相当于人类轻度认知障碍的迹象。尽管这只是一项基于观察的研究,但新发现挑战了人工智能将很快取代人类医生的假设。
过去几年,人工智能尤其是大语言模型生成能力取得了巨大进步。在医学领域,这些发展引发了猜测:这些大语言模型能在医疗任务上超越人类医生吗?尽管先前的多项研究表明,大语言模型在一系列医学诊断任务上表现非常出色,但它们的认知能力变化还需要进一步验证。
为填补这一知识空白,以色列哈达萨医疗中心等机构的研究人员使用“蒙特利尔认知评估量表”测试了多个领先和公开的大语言模型的认知能力。这些大语言模型包括由美国开放人工智能研究中心(OpenAI)开发的GPT-4和GPT-4o、由美国Anthropic公司开发的“克劳德3.5”以及由美国谷歌公司开发的“双子座1.0”和“双子座1.5”。
“蒙特利尔认知评估量表”广泛用于检测认知障碍和阿尔茨海默病的早期迹象,通常用于老年人。通过一系列简短的任务和问题,该测试可以评估注意力、记忆力、语言、视觉空间技能和执行功能等能力。得分最高为30分,通常得分26分及以上被视为认知正常。
测试结果显示,GPT-4o得分最高——26分,“双子座1.0”得分最低——16分。所有大语言模型都能很好地完成命名、注意力、语言和抽象等方面的任务,但在视觉空间技能和执行功能测试中都表现不佳。在进一步的视觉空间测试中,大部分大语言模型无法准确解释复杂的视觉场景。
研究人员表示,在需要视觉抽象和执行功能的任务中,大语言模型几乎“全军覆没”,这表明人工智能在临床环境中的使用可能会有困难。因此他们开玩笑说,神经科医生不仅不太可能很快被大语言模型取代,而且他们可能会发现自己将迎来新的“虚拟患者”——表现出轻度认知障碍的人工智能模型。
最新发现
相关资讯
研究:人工智能在认知障碍测试中表现不佳
《英国医学杂志》最新发表的一项研究显示,在广泛用于检测阿尔茨海默病早期症状的测试中,大部分参与测试的人工智能大语言模型都表现出相当于人类轻度认知障碍的迹象。尽管这只是一项基于观察的研究,但新发现挑
2025-04-01 13:46:58
人工智能大模型“走进寻常百姓家”
7月2日拍摄的2024全球数字经济大会标识。新华社记者 任超 摄 新华社北京7月4日电(记者郭宇靖、吉宁、张骁)“早上好!”拉开车门,车内响起轻柔问候。“我感到有一点热。”坐进主驾,空调自动送出凉风。越来越多中
2025-04-01 13:26:53
人工智能、金融服务……以科技创新为引领未来产业这样布局→
中央经济工作会议对2025年经济工作进行了具体部署。会议提出明年的重点工作之一是“以科技创新引领新质生产力发展,建设现代化产业体系”。如何加快形成新质生产力?未来产业如何布局?围绕中央经济工作会议的部署
2025-04-01 13:06:48
走下神坛?AI玩具领域受到消费者追捧爆款频现
今年上半年,以大模型为代表的AI被认为是悬在空中的概念,离普通老百姓的生活很远。“AI泡沫”也一度成为业界流行的词汇。今年下半年以来,AI从争议中走向应用,随着多个爆款应用的出现,AI与人们的日常生活越来越
2025-04-01 12:46:45
大咖畅谈AI发展前景:数据、生态仍是关键,AIAgent极具潜力
12月20日,以“智能・进化”为主题的2024创原会年度技术峰会在海南成功举办。峰会期间,华为云副总裁、战略与产业发展部总裁黄瑾,德勤全球华为客户服务领导合伙人程中,CSDN创始人&总裁蒋涛,值得买科技CTO王
2025-04-01 12:26:44
AI加持的荣耀互联网服务究竟能带来哪些可能?
机会总是与风险并存,正是因为结果的不确定性,不同人对于风险的不同偏好就决定了我们对变革的迥然态度。而现在,我们又走到了下一个转变的十字路口。这一次的转变,由AI引领。2023年GPT的横空出世引领了生成式AI
2025-04-01 12:06:43
今日热榜
龚克:使用AI要保持自己的选择权,不能它说什么就是什么
2025-02-24 15:14:12为什么AI在广告投放上受追捧,创意上却饱受非议?
2025-02-19 13:57:58中国大模型助力AI技术更开放更高效
2025-03-17 10:28:27上海如何推进“人工智能+生物医药”创新高地建设?
2025-03-18 15:49:07从产业布局看中美AI发展路径差异
2025-01-20 15:35:51百家云CEO马义荣获「2024年度人工智能杰出人物」
2025-01-24 11:32:17积极推动全球人工智能包容普惠发展
2025-02-14 16:28:552024人工智能与水下机器人高峰论坛举行
2025-02-18 17:54:28电子行业AI创新驱动发展
2025-02-19 11:17:12早安!世界丨俄罗斯洲际导弹试射疑失败;日本推出人工智能相亲系统
2025-02-20 13:48:57热门推荐