国内大厂,为什么集体错过DeepSeek

[复制链接]
查看564 | 回复0 | 2025-2-12 07:52:50 | 显示全部楼层 |阅读模式
国内大厂,为什么集体错过DeepSeek-1.jpg
' _  }  s) c/ |* a3 _5 k% P; @% O3 g

7 h4 }: G0 `1 H3 h& ]2 C5 ~5 `0 q3 P; D. b8 k$ f) Q9 o
为什么拥有资源、人才、数据、芯片、规模、政策等等一大堆难以言说优势的一大批互联网大厂们,在持续几年你追我赶的大量投入之后,却似乎只是在进行无意义的“内卷”?
1 R0 {' U/ O1 D# x4 i5 E& d7 H  y) w: D- g' y1 A

2 ~' z% }5 o/ `( C7 I撰文丨白树真$ r1 }8 R, }1 T* s. T
2 w& i* H% A8 d9 H" L; t; ]; Y
( H/ }9 q8 X9 q7 Q" l) j/ h! D
从最初的怀疑到形成热潮,2025年DeepSeek的影响力,已经不输给2023年初ChatGPT对全球产生的冲击。/ v2 o6 e- J' Q% k; o

& {) |( y+ O4 i; m# u/ o5 T: m; W  N2 K1 f; O0 {( Z7 F' ~1 _5 f/ d2 N
但就像ChatGPT诞生时大家开始惊讶为什么人工智能的创新没有来自于IBM、谷歌、Meta之类的传统AI强势巨头,今天DeepSeek的出现,也同样引发了一个连锁问题:
3 q$ u, b* e4 u* K- |' s/ q1 O+ h9 b* k4 @6 N4 C
3 {  A1 z, \+ b- X
为什么跑得又早又快、有钱又有卡的阿里、百度、腾讯、华为、字节跳动等等一众科技大厂,甚至一度还打出“百模大战”的气势,却依然没有孵化出类似DeepSeek这样的颠覆式创新?" @# H1 X% }3 A* J

; y# A6 E4 e$ i7 V( b1 L4 P
3 e3 ]* ]3 F9 k* d- j甚至有人调侃,百度风投的北京办公室恰恰就在DeepSeek北京办公室楼上,却并没有发现DeepSeek的潜力。
6 d6 M4 k' f0 k' P  D6 P2 ]. _) |: J# n  n
' I" d1 b$ E- p5 U8 t" J" o
虽然后来百度风投对此辟谣,称第一时间就拜访了DeepSeek团队,但彼时对方并不差钱,也没有接收投资的意愿。
' M* \# @" [, R2 D0 Z: g6 H6 R
/ P. F) U# T, M8 q9 v2 _! H/ ]1 B
! u/ e; g  x& q" G8 s4 H可这样的传言风行本身就内涵着一个方向,那就是国内的科技大厂们,怎么就集体错过了DeepSeek?9 X, M8 m$ r/ s

; G) O; x, J- ^" x5 b1 ]- G  o  x& z" p- g
, {8 R6 t# `4 I0 |  Z

2 ]- @1 K2 T! V1 k01
9 M9 c* _0 W% l2 E. T, \) ], _4 }8 s3 l" z( L

( F! X2 u9 I8 W

6 E$ c! F" r1 n7 D2 g& V说实话,最开始面对DeepSeek的成功,国内科技大厂们是陷入过一阵集体沉默的。
3 y/ [. T# B6 }/ i2 K* ?: I9 v/ m4 M! s6 P: p1 j  ?
6 ?: J# Z6 j$ L. {& Q
在DeepSeek爆火之前的2023、2024年,市面上已经有足够多的大模型应用。百度的文心、阿里的通义、腾讯的元宝、华为的盘古、字节的豆包……在技术实力上每一家都投入了大量资源。+ s8 [0 d1 C' z! I

  O* i# ^5 S% C  Y5 h4 w! r7 x5 U) p
; c* \9 N9 K& ]7 n结果,一家以炒股为主业的、百人级别的初创企业,在通用人工智能领域却实现了对BAT们天量投入基础上的技术反超,实在是过于打脸。
# D+ Z3 @' N/ e8 ]& L4 ~5 h" X8 `. Q# E4 z! e0 j

  f$ ^; j$ w# t1 ?2 ?, b) \当然,后来大厂们很快调整了思路。这几天最热门的新闻之一,就是从三大通信运营商到一众互联网大厂纷纷宣布接入DeepSeek,以彰显自己对于AI技术前沿的开放拥抱态度。( k" a" D2 Y' B& z
4 y/ s. K! b% t; b! u6 K

4 W8 C! p  X' r- u: w5 M但其实了解技术细节就知道,接入API接口或者本地部署,事实上难度并不算大。真要说这些接入能为它们自身的AI产品带来多大客流和技术升级,恐怕也未必。. M& Q/ j" A$ H" i
/ z' G1 C2 A0 g, v: }3 A
* o' K8 H! x- M+ |% z
这一举动唯一能发生改变的,是谦逊和拥抱进步的姿态能够帮助有效减轻外界对于其投入大量资源却未能出现颠覆式创新的质疑,这是大公司公关手段的价值。
' O& Y7 N% p  B6 L, \. M. i
6 Z+ z2 K- n; G  L# I! B/ `8 _8 R; z5 {) A7 n* n
但真正底层的问题其实一直存在,也不是光靠公关们努力就能够解决的。那就是为什么拥有资源、人才、数据、芯片、规模、政策等等一大堆难以言说优势的一大批互联网大厂们,在持续几年你追我赶的大量投入之后,却似乎只是在进行无意义的“内卷”?
- p1 R1 x5 `5 r' j# F, T' L% R% J0 f# U- r; X" j
$ ?3 r( ?2 e1 B5 g4 ^
. h4 r; p3 @) y% `4 q* M/ `& |% F
& m( L6 W# c+ Y: ~
02! u) c' ~& u5 u1 W) z) N( W
' C8 W8 r' \) A4 @% l" e* ]) c
& ?+ c% r8 l9 a" s; v1 s

; \# m/ G( F$ H, z/ c  f除了百度文小言(原文心一言)之外,一定程度上最可惜的或许是阿里的通义千问。作为云计算时代长期位居全球前四名的实力型选手,无论是从算力还是人才角度,阿里云在孵化通义千问时应当是有巨大的先发优势的。7 s5 E7 E/ b! [

1 M7 X6 u' a& w) n3 Y$ I. ]% a4 @/ J# ]/ B1 I, ?* f; d/ T
但现实是,通义千问在公众认知度方向上的掉队速度,与百度的文小言也相差无几。如果搜索通义过去两年来的新闻会发现,这款大模型在技术上的投入并不算差,甚至可以算得上是领先状态。$ q" B' `& ?! Y
/ }( @; n- x2 z6 t% H5 H" r& y
5 Y3 y. T2 m, ?. C
早在2023年8月,阿里云就宣布全面开源通义千问70亿参数模型(Qwen-7B),随后陆续开放140亿、720亿参数版本,形成国内首个完整开源的大模型家族。在应用端上,AI开发平台“魔搭”更是能支持开发者以低代码方式调用通义千问能力,甚至形成亚洲最大AI模型社区。1 A; f8 X2 d% ]& Q" h: n
: D& h9 U6 J1 @' i, G* G+ D% q
+ n- K. T; O" X9 [
但很多人可能都有体会,在To C应用端,对于通义千问几乎没有什么感知,甚至很多人根本想不起来这款大模型产品。其影响力还不如月之暗面的Kimi助手来的认知度高。# U: i+ E: p, l5 T) }: w9 P, B2 s

$ w- _  O' |7 f& B0 F2 _, M* |
) s; M0 {/ J9 l4 r通义千问也不怎么公布自己的日活数量,这可能和产品宣传力度的投入有关系,但本质上还是因为产品的标签一直比较模糊,没有形成一个足够强大的用户心智。以至于近日当苹果把中国AI合作伙伴定为阿里巴巴时,很多人都有点意外:为什么会是阿里?, i  ]2 q6 ?) S9 I( G1 ~2 e

$ |  u9 U9 K3 ^" k" u4 ]- x2 j2 x; `0 C; w, C  Q) G+ V6 c% X- ^
当然,类似的问题其实不止是阿里,同样体现在腾讯混元身上。本身腾讯跟进AI就相对国内大厂晚了一段时间,且在应用层,并没有让用户了解到混元大模型和其他大模型产品的差异到底是哪些。
1 q: O  s) z2 H) o* V, f- [. W+ J+ ?$ y

0 ^3 c1 V- {/ P* z它更像是一个典型的腾讯系产品——别人有的,我们也要有,至于未来怎么样,看看哪个模式能跑出来再说,这样风险最低,效率最高。" Y) t4 S/ j8 y. o% F3 t
1 F" ^2 e* W* W" p' `

3 o$ n- M$ r3 q一直以来,腾讯更加擅长的是微信这样的应用创新而非DeepSeek这样的颠覆式创新,腾讯内部的赛马机制本质也是这个逻辑,先试试看,等成功路径被基本验证之后,再进行优化和推广。7 |, g$ Y0 z! g1 q

( ?6 O" u! R" S7 r& V/ i9 v( o1 `& t* {: [- D
此外,不得不提到的还有前阵子风头正劲的豆包,当字节跳动投入了大量时间和精力、资源到这款产品上,乃至于眼看就要取得AI应用市场占有率第一的最后胜利时,结果DeepSeek横空出世,以领先的颠覆式技术创新,一举打败了以往豆包在用户体验上的精心修补。
+ A  t$ L' _- u4 y, k, R
7 f. L2 x% G3 b  L8 ~( V' H4 y& p" q3 G' q) R5 w5 J
所有人都跑去下载DeepSeek了,国内一众大厂打了半天,结果一夜回到解放前。9 \5 w3 W( m! S7 f4 c
' m1 z. R2 _. {: e
/ N/ Q( V; c9 ]& N0 V6 y

0 m8 W' U. @- m! w1 e0 I
' e. a3 C; ]+ }- m& O* c1 D5 p1 \037 y, [: }# k0 q/ p5 z. ^6 T

8 @! f  l  S, l# }! O  v5 M% G  q1 m% Q1 i% d2 l( V1 b+ ~% S

9 a. [7 x* b) a( d) k, e1 Q如果非要给国内大厂为什么错过DeepSeek总结一个规律的话,那么可能是因为真正的颠覆式创新,天然就是厌恶组织化、目标化的。
0 [  n" F) z$ C8 S" F, ]) j9 P, ]  c* O( c- k
, O7 s1 o: e7 L% ]2 N
正如熊彼特所言,创新首先就是“创造性的破坏”,它意味着不确定性和巨大的风险。而这一点,与体系化的、组织化的机构目标其实是截然相反的——无论是政府投资还是大型企业组织,天然都是追逐效率而厌恶风险的。+ g5 T+ L/ H0 G

' f# Z/ I6 o0 E3 q, c, L4 `& n! t% L6 k. I; I9 `- x5 d" z
这因此也形成了一个悖论,在数学领域,这被称为哥德尔陷阱,成功的系统往往会衍生出限制其今后的内在规则。而在管理学领域,它被称为“大公司病”。
/ Z! E4 I6 w# N. n5 Q" X
9 d# J& N6 t& V. F8 r5 Z+ S3 j8 I- ^. O/ R
这种情况,其实在ChatGPT诞生时,在美国就被反思过一遍了。为什么美股一众科技巨头都没有做出ChatGPT?当时最直接的原因是由于彼时依靠堆叠算力的路线并不被看好,因为硅谷大厂们普遍认为这是低效率的路线。( y. f7 H3 u0 {. u1 M

5 K1 y6 G% w4 K* M9 @! }1 o5 c1 a5 N5 z0 m6 w
今天的DeepSeek故事是一样的:DeepSeek的混合专家模型(MoE)路线,在过去两年同样并不被各个大厂看好。0 l/ }  u; y1 S: c$ W* P* T

% b9 |3 n( U1 K! D  B  d

0 U5 o2 b. n& g7 y; s7 m6 j: }但也正如李彦宏所说,创新往往就是这样无法预测的。
' e0 t/ d) R, X9 @6 W- d
/ q! n* y  ^. \4 E, F4 {
; C2 c# ?; {5 W2 U' a而且,曾经率先做出创新的OpenAI其实就已经开始逐渐陷入到这种“大公司困境”之中。回过头看OpenAI这两年的变化,从闭源路线的选择到2024年中主动限制IP为中国地区的API接口,一度逼得中国开发者们转回国内大模型平台。难怪很多人讽刺,OpenAI正在变得越来越不Open了。' R0 C, J/ o/ f( S( t# j9 i; j
9 q4 @7 ^& Q0 i8 y* K: k

+ G6 l2 w1 x$ ?; m$ t6 z3 tOpenAI的落后,恐怕也是这几天马斯克开始提出动议收购这家公司的原因。经历了此前的政变和宫斗之后,获胜者山姆·奥特曼显然并没有做到让OpenAI持续领先。) I6 x' Q0 }# \3 \/ F

1 K1 K& c. o, u, P
$ g/ O* I9 t5 X4 H- C, ~5 D从这个角度来看,当梁文锋已开始可以登上富豪榜单,DeepSeek未来要如何继续保持过去的这种创新能力,恐怕才是最大的挑战。3 J! T. ~9 @0 y# p" h! }; z# K5 c

3 T  p4 b- b4 e4 H8 O& s- O
& \; [+ y; j) _2 R- J" [4 `$ e8 G! t*本文为冰川思想库原创文章,未经授权禁止转载,否则追究相关法律责任
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

311

金钱

0

收听

0

听众
性别
保密

新手上路

金钱
311 元