总台春晚网络春晚共产党员网秧纪录纪录片网国家大剧院大型活动

新闻国内国际评论经济军事科技法治文娱人物公益图片

人民领袖习近平联播+热解读天天学习习式妙语央视快评央视网评光华锐评新闻+

视频小央视频小央直播直播中国熊猫频道 VR/AR 4K专区全景新闻

现场前线比划快看蓝海中国新兵请入列人生第一次人生第二次

体育直播竞猜巴黎奥运会亚冬会 CBA NBA 中超国足国际足球网球

VIP会员 CCTV奥林匹克频道生活体育大会体育江湖文化体育冰雪道路足球道路

CCTV.节目官网直播节目单栏目片库收视榜总台企业白名单

新闻

新闻频道 > 科技新闻

研究：人工智能在认知障碍测试中表现不佳

来源：新华网 | 2024年12月21日 14:43:47

新华网 | 2024年12月21日 14:43:47

原标题：研究：人工智能在认知障碍测试中表现不佳

正在加载

　　新华社北京12月21日电　《英国医学杂志》最新发表的一项研究显示，在广泛用于检测阿尔茨海默病早期症状的测试中，大部分参与测试的人工智能大语言模型都表现出相当于人类轻度认知障碍的迹象。尽管这只是一项基于观察的研究，但新发现挑战了人工智能将很快取代人类医生的假设。

　　过去几年，人工智能尤其是大语言模型生成能力取得了巨大进步。在医学领域，这些发展引发了猜测：这些大语言模型能在医疗任务上超越人类医生吗？尽管先前的多项研究表明，大语言模型在一系列医学诊断任务上表现非常出色，但它们的认知能力变化还需要进一步验证。

　　为填补这一知识空白，以色列哈达萨医疗中心等机构的研究人员使用“蒙特利尔认知评估量表”测试了多个领先和公开的大语言模型的认知能力。这些大语言模型包括由美国开放人工智能研究中心（OpenAI）开发的GPT-4和GPT-4o、由美国Anthropic公司开发的“克劳德3.5”以及由美国谷歌公司开发的“双子座1.0”和“双子座1.5”。

　　“蒙特利尔认知评估量表”广泛用于检测认知障碍和阿尔茨海默病的早期迹象，通常用于老年人。通过一系列简短的任务和问题，该测试可以评估注意力、记忆力、语言、视觉空间技能和执行功能等能力。得分最高为30分，通常得分26分及以上被视为认知正常。

　　测试结果显示，GPT-4o得分最高——26分，“双子座1.0”得分最低——16分。所有大语言模型都能很好地完成命名、注意力、语言和抽象等方面的任务，但在视觉空间技能和执行功能测试中都表现不佳。在进一步的视觉空间测试中，大部分大语言模型无法准确解释复杂的视觉场景。

　　研究人员表示，在需要视觉抽象和执行功能的任务中，大语言模型几乎“全军覆没”，这表明人工智能在临床环境中的使用可能会有困难。因此他们开玩笑说，神经科医生不仅不太可能很快被大语言模型取代，而且他们可能会发现自己将迎来新的“虚拟患者”——表现出轻度认知障碍的人工智能模型。

编辑：罗萌责任编辑：刘亮

点击收起全文

返回央视网首页返回新闻频道

扫一扫分享到微信

返回顶部

望海热线

xinwenxiansuo@staff.cntv.cn

最新推荐

加载更多

精彩图集

加载更多

CCTV-1 综合	CCTV-2 财经	CCTV-3 综艺	CCTV-4 中文国际	CCTV-5 体育	CCTV-5+ 体育赛事	CCTV-6 电影	CCTV-7 国防军事	CCTV-8 电视剧
CCTV-9 纪录	CCTV-10 科教	CCTV-11 戏曲	CCTV-12 社会与法	CCTV-13 新闻	CCTV-14 少儿	CCTV-15 音乐	CCTV-16 奥林匹克	CCTV-17 农业农村

运动一起赢	欧冠开场哨	天下足球	体坛晨报	体坛快讯	体育新闻
体育世界	体谈	足球之夜	篮球公园	棋牌乐

寰宇视野	发现	人文地理	时代	特别呈现	真相
自然	万象	9视频	故事·中国	活力·源	微9

戏曲青年说	一鸣惊人	九州大戏台	CCTV空中剧院	中国京剧音配像精粹	梨园闯关我挂帅
梨园周刊	角儿来了	过把瘾	名段欣赏	青春戏苑	名家书场
宝贝亮相吧	典藏	中国戏曲像音像集萃	了不起的戏曲

乐享汇	全球中文音乐榜上榜	一起音乐吧	影视留声机	CCTV音乐厅	风华国乐
民歌·中国	精彩音乐汇	中国音乐电视	乐游天下	音乐人生	音乐公开课
聆听时刻	中国节拍	合唱先锋	音乐周刊	童声唱

北京2022	艺术里的奥林匹克	逐冰追雪	五环纪事	奥林匹克传奇	奥秘无穷
奥林匹克人	我的奥林匹克	奥林匹克新鲜说

乡土中国	共富经	三农长短说	乐游新乡村	超级农人秀	田园帮帮团
三农群英汇	乡村大舞台	乡理乡亲	谁知盘中餐	大地讲堂	农业气象

互联网新闻信息服务许可证10120170003 网上传播视听节目许可证号0102002 新出网证（京）字098号

京ICP证060535号京ICP备06036302号-2 京ICP备10003349号京ICP备10003349号-1 京公网安备 11000002000018号京网文〔2024〕4690-222号

: 网络110
报警服务

正在阅读：研究：人工智能在认知障碍测试中表现不佳

扫一扫分享到微信

手机看

扫一扫手机继续看

A- A+

新闻联播	焦点访谈	等着我	晚间新闻	经典咏流传	挑战不可能
故事里的中国	今日说法	时代楷模发布厅	开讲啦	我有传家宝	第一动画乐园
动物世界	人与自然	正大综艺	人口	国际艺苑	生活提示
中华民族	秘境之眼	典籍里的中国	中国诗词大会	生活圈

对话	经济半小时	经济信息联播	财经调查	第一时间	消费主张
欢乐大猜想	创业英雄汇	一槌定音	生财有道	职场健康课	央视财经评论
回家吃饭	中国经济大讲堂	正点财经	天下财经	生活家	魅力中国城

金牌喜剧班	我的艺术清单	走在回家的路上	你好生活	舞蹈世界	文化十分
越战越勇	黄金100秒	星光大道	开门大吉	非常6+1	我要上春晚
向幸福出发	艺览天下	幸福账单	天天把歌唱	回声嘹亮	喜上加喜
中国文艺报道

健康中国	走遍中国	环球综艺秀	美食中国	深度国际	中国新闻
今日关注	今日亚洲	中国文艺	海峡两岸	远方的家	中国舆论场
国家记忆	记住乡愁	国宝·发现	今日环球	华人故事	中国缘
鲁健访谈

谁是终极英雄	军事科技	军营的味道	军迷行天下	五星剧场	国防军事早报
防务新观察	军事报道	军歌嘹亮	砺剑	讲武堂	军事纪实
老兵你好	正午国防军事	军事制高点	军事纪录	第二战场	兵器面面观
世界战史	国防故事	军武零距离

百家讲坛	地理·中国	自然传奇	味道	健康之路	探索·发现
透视新科技	实验现场	科幻地带	科学动物园	时尚科技秀	人物·故事
考古公开课	跟着书本去旅行	百家说故事	读书	解码科技史	创新进行时
中国影像方志

剧懂法	警察特训计划	小区大事	法律讲堂生活版	一线	法律讲堂文史版
夜线	热线12	方圆剧阵	夕阳红	生命线	见证
天网	从心开始	现场	道德观察	心理访谈	热心话
法治深壹度	全网追踪	律师来了	决不掉队

焦点访谈	面对面	国际时讯	环球视线	每周质量报告	法治在线
新闻直播间	共同关注	午夜新闻	新闻30分	朝闻天下	24小时
新闻调查	新闻1+1	世界周刊	东方时空	新闻周刊	军情时间到
高端访谈

周末动画片	快乐体验	小小智慧树	智力快车	音乐快递	英雄出少年
快乐大巴	动漫世界	新闻袋袋裤	大风车	七巧板	大手牵小手
智慧树	动感特区	动画大放映	看我72变	快乐童行	风车剧场

	下次自动登录	忘记密码