2025年,全球AI领域风起云涌。通用人工智能(AGI)开始祛魅,超级人工智能(ASI)登上舞台。Anthropic高管Jack Clark警告:巨变在即,AI将把世界撕裂为两个平行宇宙。这一年,我亲眼见证了从「Code Red」到模型混战、从英伟达$5万亿神话到DeepSeek逆袭、从智能体元年到55,000人AI裁员……这不仅仅是技术革命,更是人类命运的转折点。

🎢 过山车般的一年:从「Code Red」到模型混战

Gemini 3 Flash
Google Gemini 3 Flash:2025年底模型混战的代表作之一(图源:TechCrunch)

25天,4巨头,一场模型狂欢

如果要用一个词形容2025年AI行业,我会选「疯狂」。

从11月17日到12月11日,短短25天内,四大AI巨头相继发布了各自最强的前沿模型:xAI的Grok 4.1(11月17日)、Google的Gemini 3(11月18日)、Anthropic的Claude Opus 4.5(11月24日)、OpenAI的GPT-5.2(12月11日)。

这场「模型发布潮」的背后,是一场激烈的市场争夺战。

日期 公司 模型 关键突破
11月17日 xAI Grok 4.1 AIME 2025 数学 88%
11月18日 Google Gemini 3 AIME 2025 数学 95%,多模态登顶
11月24日 Anthropic Claude Opus 4.5 编码任务 LMArena 榜首
12月11日 OpenAI GPT-5.2 GDPval 专业任务 70.9%

OpenAI的「Code Red」

12月初,一份OpenAI的内部备忘录曝光,CEO Sam Altman在其中发出「Code Red」警报——ChatGPT的流量正在下滑,市场份额被Google和Anthropic蚕食。

说实话,这个消息让我有点意外。毕竟,ChatGPT是开启这场AI革命的产品,怎么会「失宠」?

但数据不会撒谎。Gemini 3发布后,Salesforce CEO Marc Benioff在X平台上说:「我用了两小时Gemini 3,我不回去了。进步太疯狂了——推理、速度、图像、视频……一切更敏锐、更快。感觉世界又一次改变了。」

要知道,他用了ChatGPT将近三年。三年的「朝夕相伴」,竟抵不过Gemini 3上手两小时。

模型能力:超越人类基准线

根据斯坦福大学《2025年AI指数报告》,AI已在7项测试中超越人类基准线:图像分类、视觉推理、中等阅读理解、英语语言理解、多任务语言理解、竞赛级数学、博士级科学问题。

目前,AI系统唯一尚未赶上人类的领域是多模态理解与推理——涉及跨多种格式和学科的处理。但这一差距正在迅速缩小。MMMU基准测试中,Gemini 3 Pro取得了89.8%的得分,而2023年底谷歌Gemini只有59.4%。

两年时间,30个百分点的提升。这个速度,让人既兴奋又恐惧。

💰 资本狂欢:5000亿美元的豪赌

估值狂飙:OpenAI $500B,Anthropic $350B

2025年,AI公司的估值像坐了火箭。

OpenAI:3月,完成400亿美元融资,估值达到3000亿美元;11月,通过二级市场交易,估值已飙升至5000亿美元

Anthropic:年初估值615亿美元,11月完成130亿美元融资后,估值跃升至1830亿美元——不到一年,估值翻了近三倍。更疯狂的是,据报道Anthropic正在筹备IPO,估值已超过3500亿美元。

xAI:马斯克的AI公司,估值已达2000亿美元,7月融资100亿美元。

这些数字意味着什么?OpenAI和Anthropic两家公司,加起来占据了2025年全球风险投资的14%

科技巨头的「军备竞赛」

不只是创业公司,科技巨头们也在疯狂投入。

公司 2025年AI资本支出 同比增长
Microsoft $1000亿 +40%
Google $910-930亿 +35%
Meta $700-720亿 +25%
Amazon $750亿+ +30%

四家公司加起来,2025年的AI资本支出超过3800亿美元

扎克伯格说得很直白:「宁愿冒险误投数千亿美元,也不愿在超智能时代落后。」

这句话,既是野心,也是恐惧。

泡沫?还是真正的价值?

说实话,看到这些数字,我也有点恍惚。

一方面,AI确实在改变一切——我每天用Claude写代码、用Gemini搜索信息、用AI生成图片。这些工具已经成为我工作流的一部分。

另一方面,5000亿美元的估值,真的合理吗?Anthropic的年营收从年初的10亿美元增长到50亿美元,增长5倍。但1830亿美元的估值,意味着36倍的市销率

Gartner预测,到2025年底,至少30%的生成AI项目将被放弃,因为「数据质量差、风险控制不足、成本上升或商业价值不明确」。

泡沫会破,但技术会留。这是我对这场资本狂欢的判断。

📈 英伟达神话:首家$5万亿市值公司

NVIDIA CEO Jensen Huang at GTC 2025
英伟达CEO黄仁勋在GTC大会上宣布$5000亿AI芯片订单(图源:Getty/CNBC)

从$1万亿到$5万亿:两年半的奇迹

如果说有一家公司是AI时代的最大赢家,那一定是英伟达。

让我们回顾一下这个疯狂的时间线:

  • 2023年中:市值突破$1万亿
  • 2024年2月:9个月后,市值达到$2万亿
  • 2024年6月:3个月后,市值达到$3万亿
  • 2025年初:市值突破$4万亿
  • 2025年10月:市值达到$5万亿,成为人类历史上首家达到这一里程碑的公司

2025年,英伟达股价上涨37%。在AI加速器市场,英伟达占据80%的份额。

CEO黄仁勋预测,英伟达将获得$5000亿的AI芯片订单。他还宣布,将为美国政府建设7座新的超级计算机。

竞争:华为Ascend、AMD、Intel

但英伟达并非高枕无忧。

9月,华为发布了Ascend AI芯片路线图,直指英伟达。Atlas 950超节点支持8192颗Ascend芯片,Atlas 950超集群将使用超过50万颗芯片。更进一步的Atlas 960版本(2027年发布)将支持超过100万颗芯片。

英伟达也承认:「竞争无疑已经到来,而且势头正在增强。」

不过,据美国外交关系委员会的报告,华为的AI芯片产能到2027年仍只有英伟达的2%。「即使华为AI芯片产量增加100倍,到2027年也只能达到英伟达产出的一半。」

差距依然巨大。但竞争,已经开始了。

🇨🇳 中国黑马:DeepSeek的逆袭与开源崛起

$600万 vs $1亿:效率的胜利

2025年1月20日,一家来自杭州的小公司DeepSeek发布了R1模型,震惊全球。

为什么震惊?因为DeepSeek-R1的性能匹敌OpenAI的o1,但训练成本只有$600万——不到GPT-4训练成本的1/15,使用的GPU数量只有Meta Llama 3.1的1/10

更关键的是,DeepSeek采用MIT开源协议,任何人都可以免费使用。

1月27日,DeepSeek超越ChatGPT,成为iOS App Store下载量第一的免费应用。同一天,英伟达股价暴跌18%

登上Nature封面

DeepSeek-R1成为历史上第一个通过同行评议、登上Nature封面的大语言模型(2025年9月18日,Vol.645 Issue 8081)。创始人梁文锋入选Nature年度十大人物。

《Nature》的评价是:「DeepSeek R1证明了开源模型不再只是非商业研究项目,而是可以匹敌甚至超越闭源模型的可行、可扩展的替代方案。」

制裁,反而激发了创新

有意思的是,DeepSeek的成功恰恰发生在美国对华AI芯片禁令之后。

禁令限制了中国获得英伟达顶级GPU的能力,但这反而倒逼DeepSeek走上了一条不同的路——效率优先、资源池化、算法创新

DeepSeek巧妙地使用了混合专家(MoE)、强化学习、数据蒸馏等现有技术,实现了意料之外的推理效率。它还首次向用户展示了模型的「思维链」推理过程。

正如MIT Technology Review所说:「制裁非但没有削弱中国的AI能力,反而推动了像DeepSeek这样的创业公司以效率优先、资源共享和协作的方式进行创新。」

🤖 智能体元年:从聊天机器人到自主代理

从Operator到ChatGPT Agent

2025年,AI从「聊天机器人」转向「智能体」。

1月23日,OpenAI发布Operator——一个可以使用网页浏览器自主执行任务的AI代理。它能填写表单、下单购物、预约日程。

7月17日,OpenAI发布了更强大的ChatGPT Agent,整合了Operator的网页交互能力、Deep Research的信息综合能力和ChatGPT的对话智能。用户只需选择「Agent模式」,就可以让AI自主完成复杂任务。

典型场景包括:

  • 「查看我的日历,根据最近的新闻为我准备客户会议简报」
  • 「规划并购买四人份日式早餐的食材」
  • 「分析三家竞争对手,制作一份PPT」

85%企业将部署AI智能体

根据Alvarez & Marsal的数据,AI智能体市场将从2024年的51亿美元增长到2030年的471亿美元,年复合增长率44.8%。

85%的企业预计在2025年底前部署AI智能体。

Microsoft在Dynamics 365中推出了「Agentic AI」功能,Google、Salesforce、SAP也纷纷跟进。

理想与现实的差距

不过,智能体的实际表现还有很大提升空间。

ZDNet的测试显示,ChatGPT Agent的初始任务成功率只有12.5%(8个任务只成功1个)。经过系统优化后,可以达到80%的成功率。

Karpathy在年度总结中说得很对:「这更准确地说是'智能体的十年',而不是'智能体的一年'。我们有令人印象深刻的早期智能体,但仍有太多工作要做。」

🎬 多模态突破:当AI学会「看」和「创造」

AI视频:Sora 2、Veo 3、Runway Gen-4.5 三足鼎立

2025年,AI视频生成达到了「GPT-3时刻」——从实验性技术变成可用的生产力工具。

三大玩家:

  • OpenAI Sora 2(9月发布):「世界状态持久性」技术,确保角色服装、伤疤、背景道具在不同镜头间保持一致
  • Google Veo 3(I/O 2025发布):4K原生渲染、60fps输出,被认为是唯一适合广播电视的选择
  • Runway Gen-4.5(12月1日):Elo得分1247,超越Veo 3和Sora 2 Pro,登顶基准测试

Runway CEO Cristóbal Valenzuela说:「我们用100人的团队,超越了万亿美元级别的公司。只需保持极度专注和勤奋,就能到达前沿。」

迪士尼$10亿投资OpenAI

12月11日,迪士尼宣布向OpenAI投资10亿美元,允许用户使用Sora 2生成200多个迪士尼版权角色,包括迪士尼动画、皮克斯、漫威和星球大战的角色。

这是AI进入主流娱乐产业的标志性事件。

AI音乐:每天700万首歌

AI音乐生成同样爆发。

Suno:v5版本在9月发布,支持「超逼真、类人声音」,11月完成2.5亿美元融资,估值24.5亿美元。据投资者推介材料,Suno每天生成700万首歌——每两周就产出相当于整个Spotify曲库的音乐量。

Udio:与环球音乐集团达成和解,从「一键生成新歌」转型为「粉丝互动平台」,允许用户混音和改编已授权的IP。

ElevenLabs:8月推出Eleven Music,与独立音乐组织Merlin和版权方Kobalt达成授权协议,可能成为第一个真正合法的商业AI音乐平台。

🦾 机器人觉醒:从工厂到家庭

Tesla Optimus Robot Miami Demo
Tesla Optimus机器人在迈阿密演示活动上(图源:Electrek)

Tesla Optimus:2025年底部署5000台

马斯克的人形机器人Optimus在2025年取得了实质性进展。

12月3日,Tesla展示了Optimus在实验室中奔跑的视频,引发社交媒体热议。Optimus身高5英尺11英寸,重160磅,拥有超过40个自由度(包括11自由度的手),配备2.3kWh电池,可以工作几乎一整天。

马斯克计划在2025年底部署5000台Optimus,并在2025年Q3财报会议上宣布,Optimus V3将于2026年Q1发布。

他甚至预测:Optimus将占Tesla未来80%的价值。预计量产价格在$20,000-$30,000之间。

Figure AI:BMW工厂的1250小时

Figure AI的Figure 02机器人在BMW南卡罗来纳州斯帕坦堡工厂部署了11个月,执行重复性的钣金装载任务。

成绩单:

  • 累计运行1250+小时
  • 行走约200英里
  • 参与生产超过30,000辆BMW汽车
  • 放置准确率超过99%

挑战:迈阿密的那一摔

但机器人也暴露了问题。

12月,在迈阿密的「Autonomy Visualized」活动上,一台Optimus机器人在做出异常的向上手势后向后摔倒。这个手势被认为像是在模仿操作员摘下VR头盔的动作,引发了关于机器人是否真正自主的质疑。

iRobot联合创始人Rodney Brooks直言:「人形机器人作为万能助手的想法是纯粹的幻想,部分原因是机器人'协调能力不足'。」

💼 职场裂变:55,000人的AI裁员与新机遇

2025年:117万裁员,55,000因AI

2025年,美国共裁员117万人,创下2020年疫情以来的最高纪录。其中,55,000人的裁员直接归因于AI。

大厂案例:

公司 裁员人数 原因
Microsoft 15,000 AI工具(如GitHub Copilot)编写30%新代码
Amazon 14,000 AI实现更精简的组织架构
Workday 1,750 资源重新分配到AI投资
Salesforce 4,000 AI处理公司一半的工作
IBM 8,000 HR部门被AI聊天机器人取代

20-30岁:失业率上升3%

最受冲击的是年轻人。

2025年,20-30岁科技相关岗位的失业率上升了近3个百分点,明显高于其他年龄段和行业。3月,22-27岁大学毕业生的失业率达到5.8%,创四年新高。

入门级岗位受冲击最严重——AI越来越擅长自动化初级工作。

另一面:AI创造119,900个岗位

但故事还有另一面。

2024年,AI增长直接创造了约119,900个岗位——其中8,900个用于开发、训练和运营AI模型,110,000个来自数据中心建设。

相比之下,2024年因AI失去的工作约为12,700个。

Goldman Sachs的经济学家认为:「技术驱动的失业通常会在两年内消失。」他们对AI导致大规模失业的说法持怀疑态度。

黄仁勋的警告

英伟达CEO黄仁勋说得很直白:

「每份工作都会受到影响,而且是立刻受到影响。这是毋庸置疑的。你不会被AI取代,但你可能会被更善于使用AI的人取代。」

OpenAI的奥特曼补充道:「如果我现在22岁刚毕业,我会觉得自己是史上最幸运的一代。」但他也担忧年长员工如何适应AI重塑的工作环境。

⚖️ 全球监管:从放任到规制

欧盟:AI法案正式生效

2025年2月2日,欧盟AI法案正式生效——这是全球首部全面的AI监管法律。

欧盟采用风险分级方法:

  • 禁止类:社会评分系统、实时人脸识别(特定场景除外)
  • 高风险类:医疗诊断、招聘筛选、信用评估——需要风险管理、数据治理、透明度和人类监督
  • 通用AI模型:2025年8月起适用新规,需要遵守即将发布的《实践守则》

美国:创新优先

美国走了一条不同的路。

2025年1月,Trump政府发布行政令,撤销了2023年Biden的AI安全行政令。核心目标是消除被视为阻碍创新和美国AI主导地位的联邦政策。

12月11日,Trump又发布新行政令,旨在保护美国AI创新免受「各州最繁琐和过度法律」的影响,推动联邦统一框架。

美国的策略是依赖自愿性的NIST AI风险管理框架,给企业更多创新空间。

中国:监管数量=过去三年总和

中国在2025年上半年发布的AI相关法规,数量等于过去三年的总和。

关键法规包括:

  • 生成式AI模型需向监管机构提交部署前安全评估
  • AI生成内容必须包含可见、不可磨灭的水印
  • 「拟人交互服务」新规(针对模拟人格和情感互动的AI系统)
  • 9月1日起,所有在线服务必须明确标注AI生成内容

中国还提议成立世界人工智能合作组织(WAICO),协调全球AI监管。

分歧:效率 vs 安全 vs 合规

三大经济体的AI治理理念存在根本分歧:

  • 欧盟:风险管控,约束性法规,董事会层面的问责
  • 美国:创新优先,自愿性框架,企业自主决策
  • 中国:安全合规,政府审批,内容可溯源

这种分歧,可能会影响全球AI产业的发展轨迹。

🔮 AGI还是ASI?科技领袖的预言

Sam Altman at Senate hearing
OpenAI CEO Sam Altman:「我们已经跨过事件视界,起飞已经开始」(图源:Getty/TechCrunch)

奥特曼:「我们已经跨过事件视界」

2025年,OpenAI CEO Sam Altman在博客中写道:

「我们现在有信心知道如何构建我们传统理解的AGI。」
「我们已经跨过事件视界;起飞已经开始。人类正接近构建数字超级智能。」

他预测了三个阶段:

  • 2025年:智能体加入劳动力,执行真正的认知工作
  • 2026年:系统能够发现新洞察
  • 2027年:机器人能够在现实世界中执行任务

马斯克:2026年超越最聪明的人类

马斯克的预测更加激进:

  • AI将在2026年超越最聪明的个体人类
  • 2029年,超越全人类的集体智慧
  • xAI的Colossus 2有「非零概率」实现AGI

他警告:「值得担忧的不是AGI本身,而是从AGI到超级智能的速度。」

阿莫代:2027年,AI在几乎所有领域超越人类

Anthropic CEO Dario Amodei同样看好,认为到2027年,AI将在「几乎所有领域」超越人类。

Karpathy:「我们在召唤幽灵,而非培养动物」

前特斯拉AI负责人Andrej Karpathy在2025年度总结中提出了一个深刻的洞察:

「2025年是我首次开始以更直观的方式内化理解LLM智能的'形态'。我的框架是:我们不是在'进化/培养动物',我们是在'召唤幽灵'。」

他指出,LLM是一种全新的智能形态——「比我预期的聪明得多,也比我预期的笨得多」。它们在可验证领域(如数学、编程)表现出色,但在其他领域则表现参差不齐。

关于智能体,Karpathy认为:「这更准确地说是'智能体的十年',而不是'智能体的一年'。」

质疑声

当然,也有人持怀疑态度。

Gary Marcus不认为AGI是「基本已解决的问题」。

Mustafa Suleyman说:「这方面的不确定性如此之高,任何绝对性的声明都显得缺乏根据。」

在一项针对2700多名AI研究人员的调查中,研究人员集体估计,到2027年,AI系统有10%的概率在大多数任务上超越人类。

10%,是一个微妙的数字——既不高,也不低。

🎯 写在最后:2026年,我们该期待什么?

三大共识

回顾这一年,科技领袖们达成了三点共识:

  1. 善用AI,否则被更懂AI的人取代——这是职场生存法则
  2. 软技能比以往更重要——同理心、协作、沟通成为稀缺资源
  3. 人类必须居于AI的核心——技术是工具,智慧在人

我的个人思考

说实话,写完这篇总结,我的心情很复杂。

一方面,我每天都在用AI——写代码、查资料、生成图片、整理思路。它确实让我变得更高效,做到了以前做不到的事。

另一方面,我也在思考:当AI越来越强,我的价值在哪里?

Karpathy说,LLM是「幽灵」,不是「动物」。它们很聪明,但它们不是人。它们没有真正的理解,没有真正的创造力,没有真正的意图。

也许,这就是答案:AI是工具,人才是目的。

2025年,我们见证了太多。2026年,还会有更多。

但无论技术如何进化,我相信一件事:那些能够思考「为什么」而不仅仅是「怎么做」的人,永远不会被取代。

这一年的AI,让我更加确信这一点。