DeepSeek 根本不是什么中国 AI 战胜了美国 AI 的狭隘叙事,而是开源对闭源的胜利。随着 Open AI 逐渐远离初心,而 DeepSeek 现在有个绝佳的机会去填补这一生态位。
作者|刘正
Simon Kucher 战略咨询顾问
看到朋友圈和拜年短信的文采突飞猛进,连最不善言辞的同事都写出了 " 雪映朱门添瑞气 " 的工整祝福,我知道,这个暖雪纷飞的蛇年春节,已被 DeepSeek 的一鸣惊人彻底改变。
这场人机合力,迅速火遍全国的 AI 大学习,让每个平凡灵魂都触摸到了未来的温度,却也让大洋彼岸自命不凡的硅谷精英如鲠在喉—— "CloseAI" 引以为傲的算法霸权,终被量化小子们的数学天赋跨界击碎。硅谷新贵蜷缩在加密会议室,翻看着熟悉到直冒冷汗的陌生文档,第一次意识到:技术护城河困住的,也许不过是自己的傲慢。
我们此刻见证的不仅是中国技术的突围,也是对很多行业 " 伪共识 " 的消解和重构,不同视角的新观点冒泡,复制,分叉,剪枝,却也陷入了不少迷思。在 DeepSeek R1 诞生的第十日,是时候撇清这些迷思,看到 DeepSeek 真正给我们带来的希望。
迷思 1:釜底抽薪论—— DeepSeek 击垮了纳斯达克牛市?
Money never sleep, 尽管一开始被时差和偏见遮蔽了视线,海外资本市场还是对 DeepSeek 的发布做出了剧烈的反应——在意识到一家被技术封锁的中国 LLM" 小作坊 " 用三十分之一的算力成本(GPU 小时数)就训练出接近 OpenAI 最新 o1 模型的效果之后,投资人对 NVIDA 乐观的 GPU 需求预测产生了怀疑:在 FOMO(Fear of Missing Out)情绪引发的这波抢购热潮停歇后,被 DeepSeek 泼了一盘冷水的互联网 " 冤巨头 " 们是否还愿意给 NVIDA 抬轿子?或者干脆砍单止损?而美股这波 AI 牛市的发动机,正是拥有惊人估值的 NVIDA。
无怪乎 NVIDA 在除夕夜带着一众互联网股票纷纷跳水,仿佛一夜之间估值的底层假设—— AI 基础设施对 GPU 的旺盛需求——已经不复存在了。
但从历史的经验看,这个推理有失严谨。生产效率的优化可能带来短期内对原料的需求减少,但这一技术进步带来的成本优势将转化为应用场景的翻倍,并最终传导到对供给端更多的需求上。
这一机制,最初由英国经济学家威廉 · 斯坦利 · 杰文斯(William Stanley Jevons)在 1865 年发现:蒸汽机效率的提高并非减少了,而是导致了对煤炭需求的持续增长,这是因为高效的蒸汽机逐渐进入了社会生产的每一个角落。这一反常识的现象后被命名为 " 杰文斯悖论 "(Jevons Paradox)。
而在 IT 行业,杰文斯悖论的变体以 " 安迪比尔定律 " 的名字众所周知 : What Andy gives, Bill takes away。每当摩尔定律给 Intel 带来更高效的处理器,Windows 和其他新软件都能把性能压榨光。在智能手机时代,内存永远不够用的你一定对这个定律带来的痛苦深有体会。算力技术的效率升级,本身就会激发应用端的创新,带来更多的需求,而这会创造出对算力供给永无止境的渴望。
在当前跑马圈地的阶段,DeepSeek 的方法如果能给业界带来 10 倍的效率提升,那这种提升并不会意味着改用 10 倍小的 GPU 集群来训练出当前水平的模型,而是应当用规划中的大规模 GPU 集群,甚至是要再追加算力去训练 10 倍强的模型,以争取更加领先的技术地位。
从财务的角度看,这是非理性的豪赌。但在战略的高度,这是加速竞争下的必然选择:不选择跟的玩家,会以比过去快 10 倍的速度被甩下。所以我们看到 Meta 选择大幅增加资本支出至 600 亿至 650 亿美元以扩大其人工智能(AI)基础设施,这并非对 DeepSeek 的忽视,相反,这是对 DeepSeek 重塑竞争格局的理性应对。而 NVIDA 的股价,亦在一日后迎来了一波合理的反弹。
迷思 2:AI 速胜论—— DeepSeek 是中美竞赛的转折点?
和对美国釜底抽薪的嘲讽相对应的,则是对 DeepSeek 不吝赞美的追捧。游戏科学创始人冯骥甚至提出 DeepSeek 是一个堪称国运级别的科技成果,认为其算力优化的策略已经突破了美国以芯片禁运为核心对中国 AI 技术发展的遏制体系。似乎美国过去的技术和工具封锁没有起到效果,中国完全能够用手头有限的算力资源,实现对美国 AI 产业的弯道超车,彻底打破半导体技术 " 小院高墙 " 的枷锁。
正如刚才分析的,DeepSeek 所发现且开源的性能优化思路,同样可以为拥有更强算力的美国 AI 巨头所采用。而 DeepSeek R1 本身的水平也只是接近 OpenAI 已经商用的 o1 模型,不及去年发布的最新 o3 模型。尽管很多人质疑 OpenAI" 过于先进,不便展示 " 的背后是空城计还是确有秘而不宣的更高起跑线(未公布模型),但仅仅只是更充足的财力和未受限的算力,就足以让美国企业能更好的去利用 DeepSeek R1 开源带来的机会。
我们不能以为只有中国团队才能利用技术进步的好处,而美国人只会固步自封。虽然缺少未开源的 know-how 和工艺细节,美国团队即便复现后也不会等比放大 DeepSeek 实现的性能水平。
在绝对优势的算力加持下,美国 LLM 技术也能获得显著的提升。毕竟,their Chinese are not worse than our Chinese,而 our Chinese may become their Chinese。
回到事实细节,此次 DeepSeek 用于训练 v3 和 R1 模型的核心算力,依然来自禁运前囤的 2000 张 H800,而此后采购的阉割版 H20 是难堪大任的。在 DeepSeek R1 的横空出世给美国商务部工业和安全局(BIS)敲响警钟后,特朗普政府势必会施加更严苛的技术禁运。这一变化对国内的 AI 产业恐怕并非幸事。
从这个角度看,DeepSeek R1 的春节攻势就像是八年抗战中的百团会战,虽然狠狠地出了一口恶气,提升了国民的士气,却也暴露了八路军在敌后的实力和弱点。就在 1 月 31 日,美国国会参议院情报委员会主席、共和党参议员 Josh Hawley 提出了《美中人工智能能力脱钩法案》(Decoupling America ’ s Artificial Intelligence Capabilities from China Act)。不仅禁止美国 AI 技术或知识产权向中国流动,还借鉴芯片禁令,禁止任何美籍及绿卡持有人参与中国 AI 研发合作,并禁止美国资金对中国 AI 的投资。这一变化,对国内的 AI 产业可谓雪上加霜。
迷思 3:烟花易冷论—— DeepSeek 仅仅是昙花一现的二手平替?
和速胜论相对应的,悲观派也逐渐浮上水面,质疑 DeepSeek 这种 " 小快灵 " 的技术绽放,是否会如春节烟花般转瞬即逝,最终被美国 AI 企业的算力优势和技术封锁继续压不得动弹。
如果 DeepSeek R1 仅仅是一个从 OpenAI 模型中蒸馏现成数据,用中国企业擅长的工程优化来做一个廉价平替的工具,这种担忧并非没有道理。
但当我们看到 DeepSeek 放下种种顾虑,毅然而然选择了真正的开源时,实际上我反而对其未来充满了信心。
深度学习三巨头之一的 Yann LeCun 对此的评价非常到位,DeepSeek 根本不是什么中国 AI 战胜了美国 AI 的狭隘叙事,而是开源对闭源的胜利。一个中国公司开发并持有的二手平替模型,和一个向全世界开源的低成本 SOTA 范式,将会有着截然不同的演变路径。
就像是安卓的历史所说明的:一个伟大的天才加上一个伟大的公司可以在闭源的设定下创造出 iOS 的传奇,但全世界的天才加上臭皮匠足以让安卓成为出货量最大的智能手机操作系统,并创造出一个蓬勃的生态。而其他轮番登台的操作系统,都早已消失在历史的电子垃圾堆里了。
DeepSeek 的开源是极具炸裂的,其模型规模和部署难度极大降低了 AI 模型进入各种应用场景的门槛。在随便一个中小企业都可以基于 DeepSeek R1 开发基于自身业务定制,且本地或云端部署运行自有可掌握的模型时,许多商业场景都会被打开。是的,DeepSeek 的 API 可能最终会在欧美被封锁,正如美国政府打算对 Tiktok、小红书要做的那样。
但无数基于开源 DeepSeek 的衍生开发模型将融入许多地区的许多业务中,这将让 DeepSeek 成为未来 AI 民主化基础设施不可分离的基石之一。如此一来,任何封锁都无法抹去中国 AI 先行者所设下的标准和基础定义。
我将无我,而我无处不在,这是 Open AI 逐渐远离的初心,而 DeepSeek 现在有个绝佳的机会去填补这一生态位。
在更深的层面,DeepSeek R1 开源的这神之一手,也让 AI 民主化的火焰又一次得以被重燃。前面说到 AI 巨头绝不会满足于为公众立刻提供低成本的模型,而是一定会让算力再投资到大模型的进一步训练中,Why? 这背后折射出的,其实是对 AGI 奇点的痴迷,或者更露骨点说,是对攫取 AI 绝对霸权的权力渴望。
这些在 AI 算力军备竞赛中不断加码的玩家,无论是 OpenAI 抑或是 Meta 都相信第一个训练出 AGI 的模型将会越过奇点,从此一骑绝尘,其模型能力的增长曲线会永远超越任何竞争对手,实现绝对意义上的碾压。
在这些不把自己当人,自然也不把普通人当人,自命为 " 超人类 " 预备役的硅谷精英眼里,这个世界上最终只需要,也只会有一个 AI,就像是地球上人科人属只有一个 Homo sapien,这就是进化的终局。
而他们最害怕的是这个 AI 之父是别人,特别是如果这个别人还和你不是你一个肤色的,那就更完蛋了。
唯一能让我们都活下去的选择,只能是那个看起来乌托邦的 AI 民主化的梦想:让每个传统的人类,都拥有自己专属 AI 模型的加持,并以可持续的能耗应用于真实的场景中。在大多数时候,这个社会不需要一个靠吸食所有数据和核聚变发电厂维持的无所不能的 OGAS(全国自动化系统俄语简称,从未建成的苏联互联网天网系统),去控制和利用所有人。我们需要的是真正帮助每个人完成手头生活和工作需求的 personal AI。
这个梦想并不在星际之门宏大叙事的愿景中,而只会在 DeepSeek 未经规划的开源演变中,方能成为现实。DeepSeek 已经证明了在有限的资源下,民主化的 AI 完全可以紧紧追上 AI 模型进步的前沿。而这,将是中国人为人类自由留下的最初的种子。
本文仅代表作者立场。
编辑|刘军
还没有评论,来说两句吧...