
版权声明
来源:学术头条,书享界(readsharecn)
2025年4月7日,AI科学家李飞飞领衔的斯坦福大学人工智能研究所近日发布了最新一期《2025年人工智能指数报告》(Artificial Intelligence Index Report 2025)。
这份长达456多页的报告是Stanford HAI发布的第8份AI Index研究,追踪了2024年全球人工智能(AI)行业的发展趋势。
Stanford HAI在官方网站上写道,“AI对社会的影响从未如此明显……2025年指数是我们迄今为止最全面、也是在这一重要时刻发布的报告。”他们还认为,“AI将是21世纪最具变革性的技术。然而,除非我们精心引导AI行业的发展,否则这项技术将难以惠及普罗大众。”
本文为这份报告揭示的AI行业的12大趋势:
完整报告:https://hai-production.s3.amazonaws.com/files/hai_ai_index_report_2025.pdf
1
AI在苛刻基准上的表现持续提升
2023年,研究人员引入了新的基准——MMMU、GPQA和SWE-bench,以测试高级AI系统的极限。仅仅一年后,性能大幅提升:在MMMU、GPQA和SWE-bench上的得分分别提高了18.8、48.9和67.3个百分点。在基准测试之外,AI系统在生成高质量视频方面也取得了重大进展,在某些场景下,语言模型智能体(language model agents)甚至在有限时间预算的编程任务中超越了人类。

△图|选择的Al指数技术性能基准vs.人类表现
2
AI正越来越多地融入到日常生活中
从医疗保健到交通运输,AI正迅速从实验室走向日常生活。2023年,FDA批准了223种AI医疗设备,而2015年仅为6种。在道路上,自动驾驶汽车不再是实验性的:美国最大的运营商之一Waymo每周提供超过15万次自动驾驶出行,而百度的经济型“萝卜快跑”(ApolloGo)自动驾驶出租车车队现在已在中国多个城市提供服务。

△图|FDA批准的AI医疗设备数量(1955-2023)
3
企业全力投入AI,推动投资和使用创历史新高
2024年,美国私营部门对AI的投资增长到1091亿美元——几乎是中国(93亿美元)的12倍,是英国(45亿美元)24倍。生成式AI尤其强劲,全球吸引私营投资339亿美元——比2023年增长18.7%。AI的商业应用也在加速:2024年,78%的组织报告称在使用AI,比前一年增长55%。同时,越来越多的研究证实,AI提高了生产力,在大多数情况下,有助于缩小劳动力中的技能差距。

△图|2017-2024年,表示其所在组织至少在一项职能中使用AI的受访者比例
4
在创造顶级AI模型方面,中国正在缩小与美国的差距
2024年,美国机构推出了40个引人注目的AI模型,显著超过中国的15个和欧洲的3个。虽然美国在数量上保持领先,但中国模型在质量上迅速缩小了差距:在MMLU和HumanEval等主要基准上的性能差异从2023年的两位数缩小到2024年的接近相等。同时,中国在AI出版物和专利方面继续领先。与此同时,模型开发越来越全球化,中东、拉丁美洲和东南亚等地区也推出了引人注目的新模型。

△图|美国顶尖模型与中国顶尖模型在LMSYS聊天机器人竞技场中的表现
5
负责任的AI生态系统不断发展,但不均衡
人工智能相关事件急剧上升,但在主要工业模型开发者中,标准化的RAI评估仍然很少。然而,新的基准如HELM Safety、AIR-Bench和FACTS为评估事实性和安全性提供了有希望的工具。在公司中,识别RAI风险和采取有意义的行动之间存在差距。相比之下,政府表现出更大的紧迫性:2024年,全球在人工智能治理方面的合作加强,包括经合组织、欧盟、联合国和非盟在内的组织发布了关注透明度、可信度和其他核心负责任人工智能原则的框架。

△图|已公布的针对热门基础模型的安全性和负责任AI基准
6
全球AI乐观情绪上升,但地区间深层次分歧依然存在
在中国(83%)、印度尼西亚(80%)和泰国(77%)等国家的大多数人认为,人工智能产品和服务是利大于弊的。相比之下,加拿大(40%)、美国(39%)和荷兰(36%)等地的乐观情绪仍然远低于其他国家。然而,情绪正在转变:自2022年以来,包括德国(+10%)、法国(+10%)、加拿大(+8%)、英国(+8%)和美国(+4%)在内的几个先前持怀疑态度的国家,乐观情绪显著增长。

△图|2022-2024年,按国家划分认为“使用AI的产品和服务利大于弊”的比例
7
AI变得更加高效、经济实惠和易于获取
由越来越强大的小型模型驱动,在达到GPT-3.5水平上的系统推理成本在2022年11月到2024年10月间下降了280倍。在硬件层面,成本每年下降30%,而能效每年提高40%。开放权重模型也在缩小与封闭模型的差距,在某些基准测试中,一年内性能差异从8%减少到仅1.7%。这些趋势共同迅速降低了高级人工智能的门槛。

△图|2022-2024年,在MMLU中得分超过60%的最小规模AI模型
8
各国政府正在加强对AI的监管和投资
2024年,美国联邦机构出台了59项与AI相关的法规,是2023年的两倍多,发布法规的机构数量也是2023年的两倍。在全球范围内,自2023年以来,75个国家的AI立法提及率上升了21.3%,自2016年以来增长了9倍。在日益受到关注的同时,各国政府也在进行大规模投资:加拿大承诺投资24亿美元,中国启动了475亿美元的半导体基金,法国承诺投资1090亿欧元,印度承诺投资12.5亿美元,沙特阿拉伯则发起了一项1000亿美元的倡议。

△图|部分供应商的顶尖模型在LSYS聊天机器人竞技场中的表现
9
AI和计算机科学教育正在扩大,但普及程度仍不够
如今,已有2/3的国家提供或计划提供K-12计算机科学教育,是2019年的两倍,其中非洲和拉丁美洲取得的进展最大。在美国,拥有计算机学士学位的毕业生人数在过去10年中增加了22%。然而,在许多非洲国家,由于电力等基础设施的不足,获得计算机学位的机会仍然有限。在美国,81%的K-12计算机科学教师表示,AI应该成为计算机科学基础教育的一部分,但只有不到一半的教师认为自己有能力教授AI。
10
工业界依然一路领先
2024年,近90%的著名人工智能模型来自工业界,高于2023年的60%,而学术界仍然是高引用率研究的首要来源。模型规模持续快速增长——训练计算每5个月翻一番,数据集每8个月翻一番,耗电量每年翻一番。然而,性能差距正在缩小:排名第一和第十的模型之间的得分差距在一年内从11.9%降至5.4%,排名前两位的差距现在仅为0.7%。前沿领域的竞争越来越激烈。

△图|AlphaFold3与用于蛋白质-配体对接的基线方法的性能对比
11
AI因其对科学的影响而斩获最高荣誉
AI的重要性与日俱增,这一点从重大科学奖项中就可见一斑:两项诺贝尔奖表彰了AI在深度学习(物理学)和蛋白质折叠(化学)中的应用,而图灵奖则表彰了AI在强化学习方面的开创性贡献。

△图|PlanBench基准下正确的实例数量
12
复杂推理仍是一项挑战
人工智能模型在国际数学奥林匹克竞赛问题等任务中表现出色,但在PlanBench等复杂推理基准测试中仍然面临挑战。即使存在可证明正确的解决方案,它们也常常无法可靠地解决逻辑任务,这限制了它们在精度至关重要的高风险环境中的有效性。

△附:来自AI Index联合主任Yolanda Gil和Raymond Perrault的一封信
随着人工智能不断重塑我们的生活、企业界和公共讨论,AI Index将继续跟踪其进展–提供一个独立的、数据驱动的视角,跨越时间和地域,观察人工智能的发展、应用和影响。
对于人工智能来说,2024年是多么美好的一年。诺贝尔物理学奖和化学奖,以及因强化学习方面的奠基性工作而获得的图灵奖,都体现了对人工智能在推动人类知识进步方面作用的认可。曾经困难重重的图灵测试已不再被视为一个难以挑战的目标,今天的尖端系统已经超越了它。与此同时,人工智能的应用正以前所未有的速度加速发展,数以百万计的人们正经常在专业工作和休闲活动中使用人工智能。随着高性能、低成本和开放模型的普及,人工智能的可及性和影响力必将进一步扩大。
在经历了短暂的放缓之后,企业对人工智能的投资出现反弹。新近获得融资的生成式人工智能初创企业数量增加了近两倍,在经过多年的低迷之后,企业采用人工智能的速度在2024年显著加快。人工智能已从边缘领域成为商业价值的核心驱动力。
政府也在加大参与力度。政策制定者们不再只是在讨论人工智能,而是在投资人工智能。一些国家启动了价值十亿美元的国家人工智能基础设施计划,包括扩大能源能力以支持人工智能发展的重大努力。全球协调不断加强,地方倡议也初具规模。
然而,信任仍是一大挑战。越来越少的人相信人工智能公司会保护他们的数据,对公平性和偏见的担忧依然存在。错误信息继续构成风险,尤其是在选举和深度伪造泛滥的情况下。对此,各国政府正在推进新的监管框架,旨在促进透明度、问责制和公平性。公众的态度也在转变。虽然怀疑的态度依然存在,但2024年的一项全球调查显示,人们对人工智能带来广泛社会效益的潜力的乐观态度明显上升。
人工智能不再只是一个关于可能性的故事,而是一个关于现在正在发生的事情,以及我们如何共同塑造人类未来的故事。
Yolanda Gil、Raymond Perrault
AI Index联合主任
参考链接:
https://hai.stanford.edu/ai-index/2025-ai-index-report
书享界保留所有权 |书享界 » 李飞飞团队发布“2025年AI指数报告”