本文源自：https://hai.stanford.edu/ai-index/2025-ai-index-report，对内容做的一些解读。
《2025 年人工智能指数报告》（Stanford HAI AI Index 2025）这个报告，全面分析了全球人工智能（AI）的技术进步、经济影响、教育、政策以及社会影响等领域，提供了数据驱动的洞察。

1. 技术进步与性能提升

模型性能快速提高：
- AI 在多项高难度基准测试（如 MMMU、GPQA、SWE-bench）上的表现显著提升。例如，2024 年相较 2023 年，MMMU 得分提高 18.8 个百分点，GPQA 提高 48.9 个百分点，SWE-bench 提高 67.3 个百分点。
- 在图像分类、视觉推理和英语理解等任务中，AI 已普遍超越人类基准。
模型差距缩小：
- 顶级模型与第 10 名模型的性能差距从 2023 年的 11.9% 缩小至 2024 年的 5.4%，前两名模型差距仅 0.7%，显示竞争加剧。
- 开源模型与闭源模型的性能差距从 8% 缩小至 1.7%，开源模型（如 Meta 的 Llama、中国的 DeepSeek）正在快速追赶。
小型模型效率提升：
- 2022 年，达到 MMLU 基准 60% 以上的最小模型是 5400 亿参数的 PaLM；而 2024 年，微软的 Phi-3-mini 仅 38 亿参数即达标，参数规模减少 142 倍。
AI 代理能力初显：
- 在 RE-Bench 基准测试中，AI 代理在短时任务（2 小时）中得分是人类专家的 4 倍，但在长时任务（32 小时）中仍落后于人类（人类得分是 AI 的 2 倍）。
生成能力突破：
- AI 在高质量视频生成方面取得进展，部分代理型 AI 甚至在特定场景下超越人类表现。

2. 经济与产业影响

创纪录的投资：
- 2024 年全球私人 AI 投资达到 1508 亿美元的历史新高，美国以 672 亿美元领先，中国为第二大投资地。
- 政府投资规模扩大：加拿大承诺 24 亿美元，中国推出 475 亿美元半导体基金，沙特阿拉伯的“超越计划”投资 1000 亿美元。
成本显著下降：
- 查询 GPT-3.5 级别模型的成本从 2022 年 11 月的每百万 token 20 美元降至 2024 年 10 月的 0.07 美元（Gemini-1.5-Flash-8B），下降 280 倍。
- 硬件成本每年下降 30%，能源效率每年提升 40%，降低 AI 应用门槛。
产业主导地位增强：
- 2024 年，近 90% 的显著 AI 模型来自产业（2023 年为 60%），学术界仍为高引用研究的首要来源。
- 模型规模快速增长：训练计算量每 5 个月翻倍，数据集每 8 个月翻倍，能耗每年翻倍。
就业需求激增：
- 对机器学习技能的需求激增，调查显示越来越多的工人预计 AI 将改变其工作。

3. 科学与医学中的 AI

科学突破加速：
- 2024 年 AI 推动多项科学进展，如 Aviary（生物任务的 LLM 代理）和 FireSat（野火预测增强）。
- 蛋白质科学数据库显著扩展：2021 年以来 UniProt 增长 31%，PDB 增长 23%，AlphaFold 增长 585%。
- 两项诺贝尔奖授予 AI 相关突破：Google DeepMind 的 AlphaFold 获化学奖。
医疗应用扩展：
- 截至 2024 年 8 月，FDA 批准的 AI 医疗设备达 950 个（2015 年仅 6 个，2023 年为 221 个）。
- 大型医疗基础模型涌现，如 Med-Gemini（多模态通用模型）、EchoCLIP（心脏病学）和 ChexAgent（放射学）。
- OpenAI 的 o1 模型在 MedQA 基准上达到 96%，较 2023 年最佳成绩提升 5.8 个百分点。
伦理研究增加：
- 2020-2024 年，医疗 AI 伦理出版物从 288 篇增至 1031 篇，增长近 4 倍。

4. 教育趋势

CS 教育普及：
- 全球三分之二的国家已提供或计划提供 K-12 计算机科学教育，相较 2019 年翻倍，非洲和拉美进步最大。
- 但非洲许多地区因基础设施（如电力）不足，教育普及受限。
AI 教育挑战：
- 美国 81% 的 CS 教师认为 AI 应纳入基础教育，但不到一半觉得自己有能力教授 AI。
新工具使用：
- ChatGPT 等 AI 工具在教师和学生中的应用增加，引发对教育影响的关注。

5. 政策与治理

法规数量激增：
- 2024 年，美国联邦机构出台 59 项 AI 相关法规（2023 年为 25 项），涉及机构数量翻倍。
- 全球 75 个国家的立法中 AI 提及率较 2023 年增长 21.3%，自 2016 年以来增长 9 倍。
- 美国地方层面，2023 年 73.7% 的政策制定者支持 AI 监管（2022 年为 55.7%）。
优先级分化：
- 数据隐私（80.4%）、失业者再培训（76.2%）和 AI 部署规则（72.5%）获高支持率，但对执法面部识别禁令（34.2%）和普遍基本收入（24.6%）支持较低。
地缘竞争加剧：
- 美国 2023 年产出 61 个重要 AI 模型，欧盟 21 个，中国 15 个；中国在 AI 论文和专利数量上领先，但质量未评估。

6. 社会影响与公众认知

AI 融入日常生活：
- 从医疗到交通，AI 正从实验室走向现实生活，如 FDA 批准的医疗设备激增。
信任与乐观分化：
- 全球 55% 的人认为 AI 产品和服务利大于弊（2022 年为 52%），中国（83%）、印尼（80%）最为乐观，而加拿大（40%）、美国（39%）较低。
- 66% 的人预计 AI 将在 3-5 年内显著影响生活，加拿大（+17%）和德国（+15%）增幅最大。
- 对 AI 公司保护数据的信心从 2023 年的 50% 降至 2024 年的 47%。
AI 危害上升：
- AI 事件数据库记录的 AI 相关事故 2024 年达 233 起，较 2023 年增长 56.4%，包括深度伪造和聊天机器人相关问题。

7. 全球竞争与地缘动态

中美差距缩小：
- 中美顶级模型性能差距缩至 0.3%，中国以 1/12 的投资规模追赶美国。
- 中国 2023 年机器人安装量超全球总和，AI 专利占全球 61%。
新兴地区崛起：
- 中东、拉美和东南亚推出强模型，AI 技术全球化趋势增强。
开源趋势：
- DeepSeek 和 Mistral 等开源模型崛起，OpenAI 计划 2025 年夏季发布首个开源模型。

总结与展望

2025 年 AI 指数报告显示，AI 技术能力快速提升，成本下降使其更普惠，同时产业竞争加剧，模型差距缩小。中美在 AI 领域的博弈持续，但中国正迎头赶上。AI 在科学、医疗和日常生活中的应用日益广泛，但伴随伦理、安全和公平访问的挑战。政策制定者需平衡创新与监管，确保 AI 以人为本发展。
这份 456 页的报告为政策制定者、研究人员和公众提供了全面的数据支持，是理解 AI 现状与未来的关键资源