斯坦福:2025年人工智能AI指数报告

内容摘要基准测试性能提升:2023年引入MMMU、GPQA和SWE-bench新基准后一年(即2024年),AI模型在这些基准上的得分分别提高了18.8、48.9和67.3个百分点。AI医疗设备审批:2023年,美国食品药品监督管理局(FDA)批准

基准测试性能提升:2023年引入MMMU、GPQA和SWE-bench新基准后一年(即2024年),AI模型在这些基准上的得分分别提高了18.8、48.9和67.3个百分点。

AI医疗设备审批:2023年,美国食品药品监督管理局(FDA)批准了223款支持AI的医疗设备,而2015年仅批准了6款。

自动驾驶服务规模:Waymo每周提供超过15万次的自动驾驶服务。

AI领域投资:2024年,美国私营领域AI投资达到1091亿美元,约为中国(93亿美元)的12倍,英国(45亿美元)的24倍。

生成式AI投资:全球生成式AI私营投资总额达339亿美元,较2023年增长18.7%。

企业AI采用率:2024年,报告使用AI的组织比例达到78%,高于上一年的55%。

AI模型产出:2024年,美国机构产生了40个知名AI模型,中国为15个,欧洲为3个。

中美模型性能差距:中国模型在MMLU和Humaneval等主要基准上的性能与美国模型的差距,已从2023年的两位数百分点缩小至2024年的接近持平。

全球公众对AI的态度:在中国(83%)、印度尼西亚(80%)和泰国(77%),大多数人认为AI产品和服务利大于弊;而在加拿大(40%)、美国(39%)和荷兰(36%),持此观点的人比例较低。

部分国家AI乐观情绪增长:自2022年以来,德国(+10个百分点)、法国(+10个百分点)、加拿大(+8个百分点)、英国(+8个百分点)和美国(+4个百分点)对AI的乐观情绪有所增长。

AI推理成本下降:从2022年11月到2024年10月,达到GPT-3.5水平系统的推理成本下降了超过280倍。

硬件成本与效率:AI硬件成本以每年30%的速度下降,能源效率每年提高40%。

开源与闭源模型性能差距:在某些基准上,开源模型与闭源模型的性能差距在一年内从8个百分点缩小至1.7个百分点。

美国AI相关法规:2024年,美国联邦机构出台了59项与AI相关的法规,是2023年的两倍多,涉及的机构数量也增加了一倍。

全球立法关注度:自2023年以来,全球75个国家立法中提及AI的次数增加了21.3%,自2016年以来增长了九倍。

各国政府AI投资承诺:加拿大承诺投资24亿美元;中国启动475亿美元的半导体基金;法国承诺投入1090亿欧元;印度承诺12.5亿美元;沙特阿拉伯的Project Transcendence计划投资1000亿美元。

K-12计算机科学教育普及率:全球已有三分之二的国家提供或计划提供K-12计算机科学(CS)教育,是2019年的两倍。

美国计算机学位毕业生增长:过去10年,美国计算机学士学位毕业生数量增加了22%。

美国K-12教师对AI教育的态度:81%的美国K-12 CS教师认为AI应成为基础CS教育的一部分,但只有不到一半( 50%)的教师认为自己具备教授AI的能力。

行业在AI模型研发中的主导地位:2024年,近90%的知名AI模型来自工业界,高于2023年的60%。

AI模型规模增长速度:训练所需的计算量大约每五个月翻一番,数据集规模大约每八个月翻一番,电力使用量每年翻一番。

顶尖模型性能差距缩小:排名第一和第十的模型之间的得分差距在一年内从11.9个百分点降至5.4个百分点,排名前两位的模型差距仅为0.7个百分点。

AI对科学的贡献:两项诺贝尔奖表彰了与深度学习及其应用相关的工作。

​文档链接将分享到199IT知识星球,扫描下面二维码即可查阅!

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1